2012-04-04 2 views
-1

일부 자바 스크립트 태그가 포함 된 HTML 파일이 있습니다. IE와 같은 일부 브라우저에서이 파일을 실행하면 일부 내용이 소스에서 캐시되고 브라우저 (예 : 일부 도시의 날씨)에 표시됩니다. 이 html 파일을 실행하고 이전에 웹 브라우저에 표시된 웹 페이지의 내용을 가져 오는 방법은 무엇입니까? 내 응용 프로그램에 내용을 표시하고 싶지 않습니다. 나는 반환 된 데이터를 파싱하고 (예를 들어 각 도시의 날씨를 추출하는) 몇 가지 특별한 내용을 추출하려고합니다. 누군가 나를 안내 할 수 있습니까?java : html 내용 얻기

+0

이 질문은 너무 불특정이며,이 seeems으로, 자바와는 아무 상관이있다. 나는'java' 태그를 자른다. – HerrSerker

+0

자바 응용 프로그램을 서버에서 사용하고 싶다. 입력을 받고 사이트에서 가져온 데이터를 반환합니다. 웹 서버에서받은 HTML 파일이나 내용을 파싱하고 선호하는 태그를 추출하려면 자바 라이브러리가 필요합니다. 그래서 제 질문은 자바에 관한 것입니다! – sajad

답변

1

당신이하려는 것은 html 스크래핑이라고합니다.

최선의 선택은 conemon 및 복잡한 작업이므로 라이브러리 형태로 도움말을 얻는 것입니다.

이 질문을 참조하십시오 : Options for HTML scraping?

0

셀레늄은 좋은 내기이다. 다른 브라우저에서 HtmlUnit, Firefox, Chrome을 지원합니다.

링크 : http://seleniumhq.org/