포럼에서 사용자의보기 및 응답과 헤드 제목 만 추출하려고합니다. 이 코드에서 url을 제공하면 코드는 모든 것을 반환합니다. 나는 단지 title 태그에 정의 된 스레드 제목과 div content 태그 사이에있는 사용자 응답 만 원할뿐입니다. 추출 방법 도와주세요. 이 파일을 txt 파일로 인쇄하는 방법을 설명하십시오.포럼에서 스레드 헤드 및 스레드 답장을 추출하십시오.
package extract;
import java.io.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
public class TestJsoup
{
public void SimpleParse()
{
try
{
Document doc = Jsoup.connect("url").get();
doc.body().wrap("<div></div>");
doc.body().wrap("<pre></pre>");
String text = doc.text();
// Converting nbsp entities
text = text.replaceAll("\u00A0", " ");
System.out.print(text);
}
catch (IOException e)
{
e.printStackTrace();
}
}
public static void main(String args[])
{
TestJsoup tjs = new TestJsoup();
tjs.SimpleParse();
}
}
감사 : D Buddy – Murali
이 방법으로 문제가 해결 되었습니까? 아니면 div 이상 선택 했습니까? – ollo