2012-04-03 6 views

답변

0

나는 당신의 예제가 "유효한"HTML이 아니라고 생각한다. 나는 표가 p 태그 안에 존재할 수 없다고 생각합니다. Jsoup은 아마도 올바른 HTML을 시행하고있을 것입니다.

+0

는 .... 잘 작동합니다. – miaccio

0

jsoup는 매우 지능적입니다. 기본 파싱 메서드를 사용하는 경우 입력 텍스트를 유효한 HTML 컨텍스트로 다시 변환합니다.

Document doc = Jsoup.parse(html);

사실, jsoup은 (HTML과 XML을 포함하여 확실) XML과 같은 텍스트를 처리 할 수 ​​있습니다. xml 형식의 텍스트를 구문 분석하기 위해 메서드를 사용할 수 있습니다. 그것은 당신의 입력을 개혁하지 않으며, 그대로 입력을 파싱합니다. 내가 기본 태그와 p 태그를 교체 한 후 jsoup와 코드를 분석 할 경우

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

+0

이것은 Jsoup로부터의 반환이 실수인지 아닌지에 대한 OP의 질문에 대답하지 않습니다. – verdammelt

+0

@ verdammelt, 예, Jsoup.But에서 잘못된 HTML 코드를 반환 할 수 있습니다. 그러나 질문자는 지능형 jsoup의 검사 및 개혁 프로세스를 피하는 방법을 찾고자합니다. –