2012-07-05 2 views
4

Haskell에서 일부 스크린 스크래핑 (Netflix에서)을하고 싶지만 사이트에 쿠키 로그인 상태가 필요하므로 대부분의 예제에서는 브라우저 자동화를 사용하여 로그인 한 브라우저에 실제 URL을 가져 와서 그 텍스트에서 긁어 낸다. 하스켈에서 해당 작업을 수행 할 수있는 간단한 방법이 있나요 https://gist.github.com/1425290Haskell은 브라우저를 통해 URL을 가져옵니다.

:

(루비) 내가 원하는 무엇의 좋은 예에서입니까?

+0

루비 코드를 음역 할 수없는 특별한 이유가 있습니까? ('System.Process' 모듈이 도움이 될 것입니다.) – huon

+0

예; Ruby 코드는 JavaScript를 사용하여 페이지를 가져 오는 브라우저를 구동합니다. 이는 JS를 지원하지 않기 때문에 Windows에서 대체 방법을 묻는 것입니다. – guthrie

+0

JavaScript가 Windows에서 작동하지만 ... 지금 사용하고 있습니다. 이 스크립트는 사실 AppleScript를 사용합니다. * OSX에만 해당됩니다. – huon

답변

3

HTTP 패키지의 Network.Browsercurl과 마찬가지로 쿠키를 지원한다는 것을 알고 있습니다. 아마도 http-conduitNetwork.HTTP.Conduit.Browser은 100 % 확신 할 수는 없지만 쿠키도 지원하기 때문에 이름이 붙여졌습니다.

+0

감사합니다. 세부 사항을 배우지는 못했지만 본 적이 있었지만 자동화 된 로그인을 강제하고 쿠키를 관리하는 것은 수동 로그인보다 복잡하고 결과에 대해 HTML을 구문 분석하는 것보다 훨씬 복잡합니다. 이 작업을 수행하는 python 예제를 찾았습니다 - 그리고 그것을 모방 할 수 있지만 원하는 가져 오기를 수행하기 위해 python 스크립트를 적용하는 것이 더 쉽습니다. (http://jacob.hoffman-andrews.com/netflix-enqueue.py.txt) 하스켈을 구현하는 데 관심이 있었는데, 얼마나 쉽 겠는가? 루비 코드가 매우 컴팩트합니다! – guthrie

관련 문제