2010-01-25 1 views
3

sgmlparser에 대한 모든 예제에서는 태그를 찾은 다음 태그의 속성/값을 찾습니다. 따라서 'google.com'을 추출 할 수있는 기능입니다. 하지만 난 태그 사이의 데이터를 원해. 그래서 내가 sgmlparser를 사용한다면, 그 태그를 닫을 때까지 그 div의 모든 것을 찾아서 추출 할 것이다. 그것은 sgmlparser의 작업입니까, 아니면 잘못된 라이브러리를 사용하고 있습니까?(python) sgmlparser 및 태그 사이의 데이터 추출 방법 (속성/값 제외)

답변

1

div가 언급되었으므로 HTML을 구문 분석하려고합니다. 그렇게하기위한 최선의 선택은 BeautifulSoup입니다.