2011-06-14 9 views
2

복잡한 웹 페이지의 자동화가 많은 프로젝트가 있습니다.복잡한 웹 페이지의 자동 검색

나는 Mechanize와 Beautiful Soup가 있다는 것을 알았지 만 복잡한 웹 페이지에서 발견되는 DOM 스크립팅과 다른 이상한 것들을 다룰 때 이러한 중단을하지 않습니까?

저는 본질적으로 "GUI 스크립팅"을 수행하거나 DOM에 액세스 할 수있게 해주는 WebKit 인스턴스를 실행하는 베어 본을 원합니다. 아이디어?

답변

0

PhantomJS로 Sahi를 사용해보세요. Sahi는 브라우저 자동화 도구이며 PhantomJS는 헤드리스 웹킷 브라우저입니다. 여기에서 설치 지침을 찾을 수 있습니다. http://sahi.co.in/w/sahi-headless-execution-with-phantomjs

면책 조항 : Sahi 제품을 만들었습니다.

+0

Sahi가 귀하의 제품임을 지적 할 가치가 있으며 이는 귀하의 권장 사항에 편견을 줄 수 있습니다. –

+0

제임스에게 다시 지적 해 주셔서 감사합니다. 나는 그것을 나타 내기 위해 답을 편집했다. –

0

어떤 플랫폼을 사용하고 있습니까? 그리고 어떤 언어를 사용 하시겠습니까?

Adobe Air에서는 Air 응용 프로그램 내에 웹킷을 포함시키고 페이지 JavaScript와 상호 작용합니다 (JS와 AIR 런타임 사이에 양방향 통신이 있음).

웹킷에 구속되지 않은 경우 Mozilla Chromeless를 사용할 수 있습니다.

당신이해야할 일이 전혀 없다면, 나는 당신이 정확히 무엇을하려고 하는지를 정확히 알 수 없습니다. (페이지를 긁어 모으고 양식을 제출 하시겠습니까?) 테스트를 위해