2009-11-26 2 views
1

안드로이드에서 잘 형식이 아닌 HTML을 파싱하려면 어떻게해야합니까?안드로이드에서 (잘 형성되지 않은) HTML을 파싱하는 방법은 무엇입니까?

나는 XOM 및 TagSoup를 사용하려고했으나 빌더 만들 때 나는 다음과 같은 오류가 발생합니다 :

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder. 

내가 XOM을 사용하는 Xerces를 설치해야하거나 내가 XOM없이 tagsoup를 사용할 수 있습니까?

답변

2

를 사용 - HTMLTidy의 포트는 충분히 경량합니다. 요청시 XHTML을 출력합니다.

+0

Glad 그것은 쓸모있다 –

0

XOM은 Xerces가 클래스 경로에 있어야 할 수도 있습니다.이 버전은 Java 버전에 따라 다를 수 있습니다. 현재 우리는 당신은 JTidy (http://jtidy.sourceforge.net/를) 찾을 수

xercesImpl-2.8.0.jar 
+1

Xerces 자체가 안드로이드에서 작동하기에는 너무 무거울 것 같아요. 안드로이드에 대한 hraping과 같은 기본 정보에 대한 정보를 찾지 못하는 이유를 이해하지 못합니다 ... – Kristof

관련 문제