2011-08-31 3 views
3

자바 스크립트가있는 사이트를 포함하여 서버 측 웹 스크래핑/탐색을 수행해야하며 호스팅 계획에서 작동 할 솔루션이 필요합니다. 섬기는 사람. python/pyside/pyqt4를 보았습니다. 완벽하게 작동합니다. 헤드리스 브라우저와 같은 사이트를 탐색 할 수있게되었습니다. 그러나 이것이 원격 서버/호스트에 설치하는 것이 가능한지 모르겠다. ...서버 측 웹 스크래핑/탐색 (JavaScript 지원 포함)

답변

2

헤드리스 브라우저가 필요한 경우 PhantomJS, 특히 Python 구현 인 PyPhantomJS를 확인해야합니다. 이 이 공유 호스팅 컨텍스트에서 작동 할 수 있습니다. 이는 실제로 호스트에 따라 다릅니다. build instructions for different platforms을 참조하십시오. 호스팅 제공 업체에 설치를 요청해야 할 수 있습니다.

이 항목을 실행하면 pjscrape (면책 조항 : this is my project)을 확인하는 것이 좋습니다. PhantomJS를 사용하여 전체 브라우저 컨텍스트에서 JavaScript 및 jQuery를 사용하여 스크래핑을 허용하는 명령 줄 도구입니다.

+0

파이썬이나 루비 또는 PHP로 구현 된 솔루션이 있는지 알고 계십니까? 내가 호스팅 공간에 업로드 할 수있는 것이 있습니까? – James

+0

또한 HTMLUnitwould는 아마 잘 할 것이라고 생각합니다 ... 이것은 자바에 있습니다 ... 당신은 자바 지원이있는 웹 호스트에 대해 알고 있습니까? – James

+0

또한 동일한 원산지 정책으로 한 도메인의 JavaScript가 다른 도메인의 데이터에 액세스하지 못하도록하면 pyscrape가 클라이언트 측에서 어떻게 작동합니까? – James

관련 문제