4
크롤링을 위해 apache-nutch-2.1
을 사용하고 있습니다. 크롤링 된 결과를 json으로 가져올 수 있습니까? apache-nutch-2.1을 사용하여 크롤링 할 Java 프로그램을 작성했습니다. 크롤링 된 결과를 JSON으로 어떻게 복구합니까? 어리석은 질문일지도 모르지만 나는 그것을 google 할 때. 그와 관련이 없습니다.Nutch 크롤링 결과를 JSON으로
크롤링 된 결과를 어떻게 추가합니까?
나는 /usr/local/nutch/framework/apache-nutch-1.4-bin/runtime/local/bin/nutch 크롤링 URL을 사용하여 크롤링했습니다. -dir 크롤링 -depth 10 -topN 1000 json을 어떻게 달성할까요? – jackyesind
@jackyesind 해당 페이지에 예제가 있습니다. 크롤링 결과를 json_pp에 전달해야 JSON 형식의 데이터를 얻을 수 있습니다. –
@pallandt 여기에 언급 된 단계를 사용하여 크롤링하는 새로운 Nutch입니다. https://sites.google.com/site/profileswapnilkulkarni/tech-talk/nutchtutorialonubuntu10easysteps 여기에서 언급했듯이이 예제를 추가하면 – jackyesind