2012-07-23 6 views

답변

5

Anemone 보석을 보았습니까? 그것은 spidering 웹 사이트를 위해 특별히 만들어졌습니다.

당신은 잡아 웹 사이트의 모든 링크 인쇄 같은 것을 할 수 있습니다 : 당신이 전체면을 거미하려면

require 'anemone' 

Anemone.crawl("http://www.example.com/") do |anemone| 
    anemone.focus_crawl { |page| puts page.links } 
end 

그것은 상당히 잘 옵션과 함께 설명되어 선택하기를, 특정 유형의 제외 링크하거나 무언가와 같은 링크를 제외 할 수 있습니다.

관련 문제