2012-02-24 5 views
0

기계화를 사용하여 많은 웹 사이트에서 데이터를 검색하고 있습니다. www.douban.com에 로그인을 시도 할 때 성공했을 때 많은 쿠키가 설정되어 있지 않은 것으로 나타났습니다. 마지막으로 Google 애널리틱스에서 온 것으로 나타났습니다. 그들은 javascript에 의해 설정되었습니다. 그러나 mechanize은 자바 스크립트를 처리 할 수 ​​없으므로 이러한 쿠키를 얻는 방법. 이 쿠키가 없으면 www.douban.com을 방문 할 수 없습니다.쿠키를 자바 스크립트로 저장하는 방법은 무엇입니까?

답변

1

PhantomJS은 JavaScript가 포함 된 모든 벨과 wisthles를 지원하는 헤드리스 웹킷 기반 클라이언트입니다. 그것은 파이썬 API (PyPhantomJS)가 불행하게도 관리자가 없어서 제거되었습니다. 당신은 아직도보고 싶을지도 모른다.

1

크롤러가 자바 스크립트 코드를 실행하는 방법을 알지 못한다면 유감스럽게 생각하지만 Javascript로 설정된 쿠키를 가져올 수 없습니다.

관련 문제