2011-01-28 10 views
4

는 RSS 피드와 같은 데이터 (구문 분석) XML에 HTML 웹 페이지를 변환하고 얻을 수있는 방법은 무엇입니까? 감사HTML (구문 분석)

+0

html을 rss 피드로 변환 하시겠습니까? – Mauricio

+0

[HTML, POST 및 GET HTTP를 모바일에 적합하게 파싱 할 수있는 올바른 JAVA 라이브러리?] (http://stackoverflow.com/questions/3590613/a-good-java-library-to-parse-html-post) -and-get-http-suitable-for-mobile) – Seth

+0

나는 html을 xml로 변환하고 xml 파싱을하고 싶다. rss 피드와 같다. –

답변

4

html로 당신이 정기적으로 SAX를 사용하여 잘 형성되어있는 경우 파서가 html을 파싱합니다.

HTML은 불행하게도 종종 잘 형성되지 않습니다. 이 경우 먼저 tag-soup를 사용하여 서버의 html을 구문 분석 할 수 있습니다. 이것이 가능하지 않으면 장치에서 jtidy를 사용해보십시오.

How to parse (non well-formed) HTML in android?