2
아네모네 (예 : https://stackoverflow.com/
)로 구멍 웹 사이트를 크롤링 할 수 있지만 특정 폴더 (예 : https://stackoverflow.com/questions
)에만 집중하려는 경우 어떻게할까요? 어떻게해야합니까? 어쩌면 "focus_crawl"방법으로?말미잘이있는 하위 폴더 만 크롤링하는 방법
아네모네 (예 : https://stackoverflow.com/
)로 구멍 웹 사이트를 크롤링 할 수 있지만 특정 폴더 (예 : https://stackoverflow.com/questions
)에만 집중하려는 경우 어떻게할까요? 어떻게해야합니까? 어쩌면 "focus_crawl"방법으로?말미잘이있는 하위 폴더 만 크롤링하는 방법
확인 keep_if 방법이
http://danneu.com/posts/8-scraping-a-blog-with-anemone-ruby-web-crawler-and-mongodb#toc_1
시도를하는 데 도움이
는 요지 https://gist.github.com/1149906이 크롤링 원하는 패턴을 통과 할 수있다.참고 : 테스트하지 않았지만 반드시 시도해보십시오.
PriteshJ에 감사하지만 마침내 대답을 찾았습니다. 'on_pages_like (/ http : \/\/stackoverflow.com \/questions \ /.)'와 같은 패턴으로'on_every_page' 대신에'on_pages_like' 메소드를 사용했습니다. 다시 –
을 보내 주시면 감사하겠습니다.이 질문에 대한 답변을 추가하고 동의라고 표시하는 것이 좋습니다. :) – PriteshJ