그래서 중첩 된 태그 정의xmlpullparser를 사용하여 HTML과 유사한 문서를 파싱 하시겠습니까?
<p>blah<strong>lah</strong>blah</p>
같은 태그를 중첩 포함 추한 파일을 구문 분석 할 수있어 내가 그들에 대해 걱정하지 않는다.
XmlPullParser parser = XmlPullParserFactory.newInstance().newPullParser();
parser.setInput(some_reader);
while (parser.next() != XmlPullParser.END_DOCUMENT) {
if (XmlPullParser.START_TAG == event) {
String tag = parser.getName();
if (tag != null) {
tag = tag.toLowerCase();
} else {
continue;
}
if ("p".equals(tag)) {
String text = parser.nextText();
// and here we go
// org.xmlpull.v1.XmlPullParserException: expected: /p read: strong
}
}
}
질문 : 그러나 그들은 XmlPullParser 실패 할 기회가 나는 모든 불필요한 태그를 제거 파일을 전처리 또는 제 3 자 라이브러리를 사용하여 w/o 벗어날 수 있을까?
편집 : 스 니펫을 실제로 의미가 업데이트되었습니다.
뭔가를 확장 – eyelidlessness
문제가 아니라고 확신하십니까
blah lah
blah? – CommonsWare당신은 [여기] (http://www.gyanportal.com/article/generic-xmlpullparser-for-android/25)와 같은 일반 구문 분석기가 필요합니다. – Samdrain