2013-03-13 1 views
1

로 반환되는 :jsoup 여러 HTML 단일 회선 (휴식 반환) 내가 긁어하려고이 HTML을

더 BRS 또는 \ n을이없는 그들이 텍스트 영역에있는 것처럼
<textarea name="notes" rows="5" cols="60">some notes go here 
    and more including a blank line: 

    and another new 
    line 
    etc 
    etc 
    </textarea> 

. 내가 EDITTEXT에 결과를 표시 할 때 다음과 같이

Element notes = doc.select("textarea[name=notes]").first(); 
    String notesStr = notes.text(); 

하지만 그 한 줄로 반환 :

some notes go here 
    and more including a blank line: 

    and another new 
    line 
    etc 
    etc 
+0

어떤 JSoup 버전을 사용하고 있습니까? * 1.7.2 *로 테스트했고 내 출력은 개행 문자로되어 있습니다. – ollo

+1

1.7.2도 사용하고 있습니다! 일반 게시 후 곧 문제를 발견, 나는 모든 파일을 먼저 파일로 저장하고있다 ... 그것은 라인 반환없이 추가되고 있었다! – charlie0440

+0

지금 작동합니까? – ollo

답변

0

이 시도 :

Element notes = doc.select("textarea[name=notes]").first(); 
String notesStr = notes.getWholeText(); 
난 쉽게 전체 텍스트를 얻을 수 있습니다

getWholeText() : 원본에있는 개행 문자 및 공백을 포함하여이 텍스트 노드의 (인코딩되지 않은) 텍스트를 가져옵니다.