정규식을 처음 접해 보았습니다.Regex 수량 한정자
다음 예제에서는 facebook.com/pages/Dr-Morris-Westfried-Dermatologist/176363502456825?id=176363502456825&sk=info
을 추출하려고합니다. 나는 게으른 한정어와 lookbehinds에 대해 읽었지만 여전히 올바른 정규 표현식을 만들 수는 없다. 나는 facebook.com\/.*?sk=info
이 작동 할 것으로 기대하지만 너무 많이 캡처합니다. 너희들도 도와 줄 수 있니?
<i class="mrs fbProfileBylineIcon img sp_2p7iu7 sx_96df30"></i></span><span class="fbProfileBylineLabel"><span itemprop="address" itemscope="itemscope" itemtype="http://schema.org/PostalAddress"><a href="https://www.facebook.com/pages/Dr-Morris-Westfried-Dermatologist/176363502456825?sk=page_map" target="_self">7508 15th Avenue, Brooklyn, New York 11228</a></span></span></span><span class="fbProfileBylineFragment"><span class="fbProfileBylineIconContainer"><i class="mrs fbProfileBylineIcon img sp_2p7iu7 sx_9f18df"></i></span><span class="fbProfileBylineLabel"><span itemprop="telephone">(718) 837-9004</span></span></span></div></div></div><a class="title" href="https://www.facebook.com/pages/Dr-Morris-Westfried-Dermatologist/176363502456825?id=176363502456825&sk=info" aria-label="About Dr. Morris Westfried - Dermatologist">
파이썬에서 HTML 파서를 검색하십시오. – hjpotter92
http://stackoverflow.com/a/1732454/2823755 – wwii