2009-03-24 2 views
3

자바 스크립트를 사용하여 데이터를 출력하는 웹 페이지를 다운로드하고 싶습니다. Wget은 다른 모든 것을 할 수 있지만 javascript를 실행하십시오. 같은콘텐츠를 생성하기 위해 자바 스크립트를 사용하는 웹 페이지 저장/미러링/크롤링

에도 무언가 : 파이어 폭스 -remote "적인 saveURL이 (www.mozilla.org, myfile.html에)"

이 좋은 것 (불행히도 명령의 종류가 존재하지 않습니다).

+0

사용하는 언어는 무엇? – UnkwnTech

답변

4

셀렌 브라우저 자동화 도구 (http://seleniumhq.org/)를 보겠습니다. 웹 페이지 방문을 자동화하고 결과 HTML을 저장할 수 있습니다.

우리는 이전 프로젝트에서 이와 비슷한 목적으로 큰 성공을 거두었습니다.

0

Windows 기반 응용 프로그램이라면 C#, Visual Basic, Delphi 등과 같은 프로그래밍 언어의 브라우저 구성 요소를 사용하여 페이지를로드 한 다음 내용을 들여다보고 저장할 수 있습니다. 브라우저 구성 요소는 IE 렌더링 엔진을 기반으로해야하며 JavaScript를 지원해야합니다. 웹 사이트 here의 스냅 샷과 관련된 질문이 있습니다. 당신에게 유용 할 수 있습니다.

다른 방법으로, 자신 만의 Firefox 확장 기능을 구축 할 수 있습니다. 자세한 내용은 here을 들으십시오 ("다음"버튼이 없으며 왼쪽 메뉴는 탐색하기에 처음에는 혼란 스럽습니다).

1

내가 Alex가 Selenium을 제안했다. Javascript가 DOM을 수정 한 후에 출력 HTML을 캡처 할 수 있도록 브라우저에서 실행됩니다.

1

브라우저 기반 접근 방식을 사용할 때의 문제점은 스크래핑 프로세스를 자동화하는 것이 어렵다는 것입니다.

좋아하는 프로그래밍 언어로 "헤드리스 브라우저"를 찾아보십시오. 또는 Jaxer을 사용하여 DOM 서버 측을로드하고 JavaScript를 실행하고 DOM을 조작하게 한 다음 이미 익숙한 동일한 JavaScript를 사용하여 수정 된 DOM을 스크랩 할 수 있습니다. 이것은 내가 선호하는 접근 방법이다.

관련 문제