내가 특정 사이트 다음찾기 앵커 텍스트 태그
에 링크 < > 태그 한 쌍의 사이에있는 텍스트를 찾으려면이있을 때 나는 콘텐츠를 찾을 사용하고 재 문자열입니다 :
r'''(<a([^<>]*)href=("|')(http://)?(www\.)?%s([^'"]*)("|')([^<>]*)>([^<]*))</a>''' % our_url
결과이 같은 것입니다 :
r'''(<a([^<>]*)href=("|')(http://)?(www\.)?stackoverflow.com([^'"]*)("|')([^<>]*)>([^<]*))</a>'''
이 대부분의 링크에 좋은 곳입니다하지만 내 태그와 링크가이 오류가 발생합니다.
([^<]*))</a>'''
에 :
(.*))</a>'''
을하지만 그냥 내가 원하지 않는 링크, 후 페이지에있는 모든 것을 가지고 내가 정규 표현식의 마지막 부분을 변경했습니다. 이 문제를 해결하기 위해 내가 할 수있는 것에 대한 제안이 있습니까?
대단히 감사합니다. – Teifion