2012-11-05 2 views
1

내 앱에서 HTML 콘텐츠를 구문 분석하고 싶습니다. 나는 그것을하기 위해 HtmlCleaner를 사용하고 싶다.안드로이드는 HTML에서 xml을 가져옵니다.

나는 HtmlCleaner가 html을 xml로 변환한다는 것을 알았습니다. 저는 XML을 파싱하는 것에 익숙해있어서 그렇게하고 싶습니다.

나는이 라인이 있습니다

tagNode을 = 새로운 HtmlCleaner (소품) .clean (새 URL ( "http://somewebsite.com"));

tagNode 콘텐츠를 가져옵니다. HtmlCleaner가 반환 한 XML 콘텐츠를 볼 수있는 방법이 있습니까? 파일을 작성하면 XML 파서를 등록 할 수 있습니다.

Tnx.

+0

데이터가 정확히 무엇입니까? 모든 예제 데이터 pls –

+0

TV 프로그램 콘텐츠가있는 웹 사이트입니다. 별로 중요하지 않습니다. XML 콘텐츠를보고 싶습니다. 그렇게 할 수있는 방법이 있습니까 ?? – Veljko

답변

1

파일에 쓸 수 있습니다. 이 HtmlCleaner Java use에서입니다 :

final CleanerProperties props = new CleanerProperties(); 
final SimpleHtmlSerializer htmlSerializer = new SimpleHtmlSerializer(props); 

htmlSerializer.writeToFile(tagNode, fileName, "utf-8"); 

당신은 writeToFile() 던질 수 있다는 IOException를 잡을 필요가 있습니다.

+0

대신 PrettyXmlSerializer를 사용했습니다! HtmlSerializer가 일부 구문 분석 오류를 발생 시켰습니다! 그러나 tnx! – Veljko

+0

가장 환영합니다 ... – iTurki