2012-11-20 3 views
2

처음에는 전체 (전체) 웹 페이지의 소스 코드를 가져오고 싶지만 웹 사이트의 일부 내용은 처음에는로드되지 않습니다. 이것과 Ajax와의 관계가 있음) Java로 한 번에로드되지 않는 내용을 어떻게 얻을 수 있습니까?자바로 웹 페이지의 소스 코드를 얻는 방법 (지연 로딩 처리 방법)

java's url.openStrem을 사용해 보았습니다. 그러나 이것은 효과가 없었습니다. 로드 된 후 콘텐츠 "loading..."이 없습니다.

대단히 감사합니다.

답변

0

자바를 실행할 수있는 헤드리스 브라우저를 사용하거나 기존 브라우저 (Java에서 다른 언어/구성 요소 시스템/인터페이스를 사용하는 것이 쉽지 않음)를 원격 제어해야합니다. HTMLUnit은 후자의 범주에 속합니다.

+0

대단히 감사합니다. htmlunit을 사용하여 문제를 해결했습니다. – user1838305

0

그런 일에 html 파서를 사용해보세요. Jericho Htmlparser이 도움이 될 것입니다.

+0

대단히 감사합니다. 너 정말 친절 하구나. 이 파서는 꽤 멋지다. 하지만 html 파일을 분석하는 것 같지만, 내가 만난 문제는 전체 (전체) html 파일을 가져올 수 없다는 것입니다. – user1838305

관련 문제