HTML, 자바 스크립트를 프론트 엔드 언어 인 & 파이썬을 백엔드/서버 측으로 사용하는 웹 사이트 업데이터 (사람들은 웹 사이트의 모습이 아닌 내용 (텍스트)를 업데이트 할 수 있습니다)가 있습니다.HTML 파싱을위한 최상의 파이썬 모듈
내가 HTML을 업데이트하는 프론트 엔드에서 매우 어렵다는 것을 발견하고를 내가 ele.innerHTML 또는 $ (ELE) .html 중에서() 브라우저에 따라 변경된 HTML을 제공합니다 (에 의해 업데이트 된 HTML을 잡을 때 젠장 때문에 IE).
그래서 나는
당신은 HTML & 잡아 정보를 분석하는 가장 좋은 파이썬 모듈은 어떻게 생각하십니까 파이썬에, 즉 백엔드에서 내 HTML을 업데이트하기로 결정했습니다?
내 요구 사항은 다음과 같습니다
- I 클래스의있는 모든 HTML 요소를 찾는 HTML &를 분석 할 것이다 "갱신"
- 모듈이
파이썬 (때문에 내 웹 호스트의) 2.5 이하에서이어야하는 것이 - "갱신"클래스의 각 요소의 경우 : innerText와 (HTML이 아닌 텍스트 만/컨텐츠)의 압축을 당신이 제안 파이썬 모듈
이 가장 적합?
- HTMLParser.py
- htmllib.py
- 다른 파이썬 2.5 호환 모듈에 대해 알고 계십니까?
Beautiful Soup이 2012 년 7 월 3 일부터 다시 활성화 된 것으로 보입니다. http://www.crummy.com/software/BeautifulSoup/ – jforberg
참으로 멋진 소식입니다! – David