2013-09-04 2 views
0

JSoup을 사용하여 HTML을 구문 분석합니다. 사용하여 분석 한 후JSoup 변형 후 텍스트가 잘못 변환되었습니다.

&ap 

: 나는의 텍스트 문자열을

Jsoup.parseBodyFragment("&ap"); 
그것은 유선 문자로 변환

:

http://mycompany.com?param=1&app=100 
:

문자가 URL에서 실제로

URL의 &ap 부분은 항상 t로 바뀝니다.

http://mycompany.com?param=1≈p=100 

내가이 HTML 인코딩을 함께 할 수있는 뭔가있을 것 같아요 : 그는 따라서 URL이 될 문자를 유선.

누군가이 문제를 해결하는 방법을 알려 줄 수 있습니까?

답변

1

어떻게 재현 할 수있는 정보를 제공해 주시겠습니까? 이 코드로 시도 :

<html> 
<head></head> 
<body> 
    <a href="http://mycompany.com?param=1&amp;app=100"></a> 
    <p>http://mycompany.com?param=1&amp;app=100</p> 
</body> 
</html> 

<a href="http://mycompany.com?param=1&amp;app=100"></a> 

을 그리고 &&amp으로이 번역되었다 :

public static void main(String[] args) throws MalformedURLException, IOException { 
    Document doc = Jsoup.parseBodyFragment("<a href=\"http://mycompany.com?param=1&app=100\" />\n<p>http://mycompany.com?param=1&app=100</p>"); 

    System.out.println(doc.toString()); 
    System.out.println(); 
    System.out.println(doc.getElementsByAttribute("href")); 
} 

그것은 인쇄합니다.