이것은 대답이 명백한 바보 같은 질문 일 수 있습니다 ... 그러나 그것을 얻을 수 없습니다.페이지 소스보기 HTTPURLConnection
아래 그림과 같이 내가 자바 프로그램을 사용하여 웹 페이지 srouce을 읽으려고 오전 :
URL url = new URL(urlValue);
HttpURLConnection urlc = (HttpURLConnection) url.openConnection();
BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream());
StringBuilder builder = new StringBuilder();
byte[] by = new byte[1024];
int byteRead;
while ((byteRead = buffer.read(by)) != -1){
builder.append(new String(by, 0, byteRead));
}
buffer.close();
이
모두 잘 작동, 나는 동일한 URL을 열 때 나는 페이지 소스 ... 를 볼 수 있습니다 브라우저에서 마우스 오른쪽 버튼으로 클릭하고 페이지 소스를 봅니다. 자바 프로그램의 페이지 소스가 브라우저에서 보는 것과 다릅니다.이 이유를 알고 싶습니다. 내가 빠진 것이 있습니까? java 프로그램에서 정확히 동일한 결과를 얻으려면 어떻게해야합니까? 이르판
어떤 차이가 있습니까? 보기 소스는 브라우저가 렌더링 과정에서 변경 한 내용을 보여주고 어떤 경우에는 스크립트로 DOM을 변경합니다. 예를 들어 IE는 속성 주위의 따옴표를 제거하고 대소 문자를 정규화합니다 ... –