자바에서 웹 페이지의 표현에 대한 질문은나는의 CharSequence에 웹 페이지의 내용을 읽을 수있는 튜토리얼을 따라 다음과 같은 방법을 내놓았다 한
public static CharSequence getURLContent(URL url) throws IOException {
URLConnection conn = url.openConnection();
String encoding = conn.getContentEncoding();
if (encoding == null) {
encoding = "ISO-8859-1";
}
BufferedReader br = new BufferedReader(new
InputStreamReader(conn.getInputStream(),encoding));
StringBuilder sb = new StringBuilder(16384);
try {
String line;
while ((line = br.readLine()) != null) {
sb.append(line);
sb.append('\n');
}
} finally {
br.close();
}
return sb;
}
그것은 URL에 의해 지정된 웹 페이지의 표현을 반환합니다 . 그러나이 표현은 필자의 Firefox에서 "view page source"와 상당히 다르며 원본 웹 페이지 (원래 "view page source"파일의 일부 데이터 세그먼트)에서 데이터를 긁어 내야하므로 항상 이 Java 표현에 필요한 텍스트를 찾지 못합니다. 어딘가 잘못 됐습니까? 귀하의 충고가 필요합니다. 덕분에 많은 도움을 받았습니다!
"상당히 다릅니다"를 정의하십시오. * 정확히 정확히 무엇이 다른가? – BalusC
엄청나게 다른, 어떻게? –