2014-04-02 1 views
2

나는 Jsoup 동작이 do the best by adding missing tag or removing existing tag을 시도한다는 것을 알고 있습니다. 그래도 오류 파서 목록에보고해야합니다. 아래는 샘플 코드입니다. 태그가 누락 된 경우 Jsoup에서 오류를보고하지 않는 이유는 무엇입니까?

final String test = "<img /><noscript><a href=\"http://www.google.com\">google</a>"; 
Parser parser = Parser.htmlParser(); 
parser.setTrackErrors(10); 
Document document = parser.parseInput(test, StringUtils.EMPTY); 
System.out.println("BEFORE: " + test); 
System.out.println("JSPARSED: " + StringUtils.remove(document.body().html(), "\n")); 
System.out.println("Tracking errors: " + parser.isTrackErrors()); 
System.out.println("Number of errors: " + parser.getErrors().size()); 

저를 제공합니다 Jsoup 새로운 nonscript 둘러싸는 태그를 삽입 있지만 오류 목록에서 문제를보고하지 않았다

ORIGINAL: <img /><noscript><a href="http://www.google.com">google</a> 
JSPARSED: <img /><noscript> <a href="http://www.google.com">google</a></noscript> 
Tracking errors: true 
Number of errors: 0 

하는 것으로. Jsoup 1.7.3을 사용하고 있습니다. 왜 그런 짓을 한거야? 이거 버그 야?

답변

0

이것은 버그가 아닙니다.

브라우저를 구문 분석 할 때 HTML이 아닌 유효하지 않은 HTML으로 구문 분석 할 때 표준을 따르고 있습니다.

그것은이었다 버전 1.7.3

U는 여기를 확인하실 수 있습니다에서 수정 된 버전 1.7.2의 버그 :의 버그의

보고서를 stackoverflow

보고서 버그 : github

관련 문제