2012-03-29 2 views
-1

Python 및 HTMLParser 모듈을 사용하여 앵커 태그 속성 (즉 href 값)을 어떻게 추출합니까?앵커 태그 HREF 추출

HTML 코드가 있고 그것을 구문 분석하고 텍스트를 사용하여 앵커 태그의 값을 찾아야합니다.

+1

아직 시도해 보셨나요? 코드가 어디에서 실패 했습니까? – hochl

+1

가능한 복제본 [어떻게 html 코드에서 href 링크를 얻을 수 있습니까] (http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin

답변

1

This question on Stack Overflow는 HTMLParser를 사용하여 링크를 추출하는 방법을 보여줍니다.

그러나 더 편리한 방법은 BeautifulSoupthis question을 사용하는 것입니다. HTML 컨텐트의 고급 스크래핑을 원한다면 BeautifulSoup의 문서를보십시오.