필자는 beautifulsoup를 사용해야하지만 필자는 어떤 파서를 가져야하는지 모른다. 나는 lxml과 html.parser 사이에 주저하거나, 그렇지 않은 이유를 망설이게한다. 웹 페이지가 lxml과 호환되는지 알아 보는 방법은 무엇입니까? 웹 페이지가 HTML 파서를 준수하는지 확인하는 방법? 많은 감사python beautifulsoup : lxml html.parser
0
A
답변
3
은색 총알이 없습니다. Different HTML parsers behave differently이며 특정 페이지에 적합한 것을 선택해야합니다. 이 경우의 작동은 기본적으로 원하는 데이터를 얻을 수 있음을 의미합니다.
lxml
파서가 일반적으로 더 빠릅니다. html5lib
이 가장 관대합니다. 파손될 부러 지거나 잘 못된 HTML이있는 경우 이러한 차이가 발생할 수 있습니다. html.parser
이 내장되어있어 추가 종속성을 피할 수 있습니다 (문제가있는 경우). 차이점을 강조 표시 한 related table입니다.
관련 문제
- 1. BeautifulSoup/lxml : 큰 요소에 문제가 있습니까?
- 2. BeautifulSoup 및 lxml 파서의 문제점
- 3. Python Beautifulsoup Google 검색
- 4. Python BeautifulSoup - 특정 퍼지/부패 태그 매칭 방지
- 5. BeautifulSoup lxml 파서 닫기 태그가 아니어야합니다
- 6. BeautifulSoup lxml 구문 분석 오류를 억제 하시겠습니까?
- 7. Python : BeautifulSoup div 클래스 사이의 문자열을 추출합니다.
- 8. lxml (python)을 사용하여 HTML 구문 분석
- 9. Python lxml E-Factory
- 10. Python LXML : CDATA 수정
- 11. Python : lxml 서식 지정
- 12. 노드 삭제 lxml python
- 13. python beautifulsoup 텍스트를 추출
- 14. BeautifulSoup (Python) 코드 최적화
- 15. Python + BeautifulSoup CSV로 내보내기
- 16. 간단한 예 BeautifulSoup Python
- 17. Python beautifulsoup 잡아 테이블
- 18. Python BeautifulSoup 긁힌 테이블
- 19. python beautifulsoup 단축 코드
- 20. Python Beautifulsoup 태그의 텍스트에 액세스 하시겠습니까?
- 21. Python beautifulsoup 레벨 1 전용 텍스트
- 22. Python - BeautifulSoup - MySql에 쓸 데이터 포맷
- 23. 자바 스크립트 소스가 포함 된 Python/BeautifulSoup
- 24. Python BeautifulSoup 문제 구문 분석 표
- 25. Python - lxml/xpath의 전체 내용보기
- 26. Python lxml (objectify) : Xpath 문제
- 27. python lxml on app engine?
- 28. Windows에 python + mechanize + lxml 설치
- 29. Android 네임 스페이스 lxml python
- 30. Python lxml - 하위 클래스로 정렬
"웹 페이지가 lxml과 호환되는지 확인하는 방법" http://lxml.de/validation.html – Dziugas