나는 파이썬에서 정규식 일치 기능을 수행 중이다. 나는 다음과 같은 코드를 가지고있다 :이미지 태그의 링크를 정규식과 일치시키는 방법
def src_match(line, img):
imgmatch = re.search(r'<img src="(?P<img>.*?)"', line)
if imgmatch and imgmatch.groupdict()['img'] == img:
print 'the match was:', imgmatch.groupdict()['img']
위의 것은 나를 위해 올바르게 작동하지 않는 것 같다. 내가이 행운이있는 반면에을 이 될 이유
def href_match(line, url):
hrefmatch = re.search(r'<a href="(?P<url>.*?)"', line)
if hrefmatch and hrefmatch.groupdict()['url'] == url:
print 'the match was:', hrefmatch.groupdict()['url']
else:
return None
누군가가 설명해 할 수 있습니다 (어쩌면처럼 보인다 경우 또는 두 가지 모두 작동합니다)? 예를 들어, href_match() 함수의 식별자에 특별한 것이 있습니까? 두 함수에서 내가 찾고있는 문자열을 포함하는 줄과 문자열 자체를 모두 전달한다고 가정 할 수 있습니다.
편집 : 내가 내가 내가 좋아하는 태그를 얻을하지 않습니다 확신 언급한다 :
<img width="200px" src="somefile.jpg">
그 이유는 내가 그것을 HTML을 생성하는 특정 프로그램을 사용하고 있다는 것입니다 그처럼 태그를 생성하지 않습니다. 이 예는 내가 항상 같은 태그를 사러 갈 건데 가정 내에서 순수하게 이론적으로 간주되어야한다
<img src="somefile.jpg">
편집 : 여기
내가에 공급하고 라인의 예입니다 입력 인수와 일치하지 않는 기능 :
<p class="p1"><img src="myfile.anotherword.png" alt="beat-divisions.tiff"></p>
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Pepe
내 대답은 아래 참조하십시오. 늦은) 링크. 이것은 최소한 도움이되지 않으며 질문에 대답하지 않습니다. 저에게 배움을 도울 내 문제에 대한 확실한 답이 있습니다. – jml
아래 내 대답에 따라, 둘 다 나를 위해 작동합니다 (대화 형 셸에서 Windows 7의 Python 2.7.1). 작동해야하지만 실패 할 입력에 대한 반례를 줄 수 있습니까? –