2012-05-28 4 views
2

이것은 현재 나를 괴롭 히고 있습니다. 문자열이 <br />jsoup clean은 원하지 않는 캐리지 리턴을 포함합니다.

등을 포함하는 경우

Jsoup는 반환 된 문자열에서 여분의 줄 바꿈을 포함한다.

String html ="TEST<br />TEST"; 

Jsoup.clean(html, org.jsoup.safety.Whitelist.basic()); 

반환

TEST\n<br />TEST 

귀찮은 \ n의 포함을 방지하는 방법에 대한 조언

?

+0

jsoup는 오픈 소스입니다. 문제가 마음에 들지 않으면 수정할 수 있습니다. – nhahtdh

+0

안녕하세요. 그 행동이 너무 이상해서 상자 솔루션이나 신뢰할 수있는 임시 해결책이 있다고 가정합니다. – jaseFace

+0

누구나이 페이지에 같은 문제로 방문하면 유사한 질문 인 http://stackoverflow.com/questions/12503117/jsoup-line-feed에서 답변을 읽을 수 있습니다. 즉, 체크 아웃 jsoup의 OutputSettings 설정 클래스. –

답변

2

Elements 클래스의 .text(); 또는 .ownText();을 사용해 보셨습니까? .text();을 것입니다 : 각 element< p>Hello< b> there< /b> now!< /p>

  1. 방법 반환하는 경우

    //If you want the whole page 
    String url = "http://www.yourwebsite.com"; 
    Document doc = Jsoup.connect(url).get(); 
    System.out.println(doc.text()); 
    
    //If you want some specific part of the page 
    Elements elems = doc.select("query"); 
    
    for (Element element : elems) { 
        System.out.println(element.text() + "\n"); 
        System.out.println(element.ownText() + "\n\n"); 
    } 
    

    text();Hello now!

그냥 쉽게 이해할 수 있도록하기 위해 ownText();가 반환 Hello there now!

  • 방법 반환 전체 테를 돌려 보내라. 당신이 가진 태그 안에 xt. ownText(); 메서드는 태그 자체의 텍스트를 반환하고 자식 태그의 텍스트는 반환하지 않습니다.

    doc.select("query");의 검색어에 대해 here에서 원하는 패턴을 검색 할 수 있습니다.

  • +0

    안녕하세요. 예를 들어 주시겠습니까? – jaseFace

    +0

    나는 내 대답을 편집했다. 더 이상의 질문이 있으면 부탁드립니다. –

    관련 문제