사이트를 스크랩하고 결과를 돌려주고 데이터를 조작하기 위해 CasperJS를 사용하는 Ruby 응용 프로그램이 있습니다.Scanting Phantom/CasperJS scrapping?
지금 내 CasperJS 스크립트는 약 200MB를 소비하므로 병렬 5 개 인스턴스를 실행하려면 계산을 수행해야합니다. :) 나는 이것을 Heroku에 배치하려고 생각하고 있지만, 나는 작업자에 대한 메모리 한계를 맞을 것이라고 확신한다.
메모리 사용을 줄이거 나 확장 가능하도록하려면 어떻게해야합니까? 나는 병렬로 10 페이지 이상을 파싱 할 수 있기를 원한다. 내가 HTML을 폐기하는 것뿐만 아니라 페이지의 모든 요소가 어디에 있는지보고 싶기 때문에 헤드리스 브라우저가되어야한다.
실제로 이미지가 필요합니다./글쎄, 더 많은 돈을 지불하고 스레드가 아닌 더 많은 직원으로 비웃을 것입니다. 어떤 방법 으로든 다른 사람이 대답하는지 보자 :) –