2013-06-21 3 views
4

크롤링을 위해 apache-nutch-2.1을 사용하고 있습니다. 크롤링 된 결과를 json으로 가져올 수 있습니까? apache-nutch-2.1을 사용하여 크롤링 할 Java 프로그램을 작성했습니다. 크롤링 된 결과를 JSON으로 어떻게 복구합니까? 어리석은 질문일지도 모르지만 나는 그것을 google 할 때. 그와 관련이 없습니다.Nutch 크롤링 결과를 JSON으로

크롤링 된 결과를 어떻게 추가합니까?

답변

1

이미 구현되어 찾고있는 기능 : Nutch-932 retrieve crawl results as JSON 위의 링크에서 사용하는 방법을 예제도 있습니다

.

+0

나는 /usr/local/nutch/framework/apache-nutch-1.4-bin/runtime/local/bin/nutch 크롤링 URL을 사용하여 크롤링했습니다. -dir 크롤링 -depth 10 -topN 1000 json을 어떻게 달성할까요? – jackyesind

+0

@jackyesind 해당 페이지에 예제가 있습니다. 크롤링 결과를 json_pp에 전달해야 JSON 형식의 데이터를 얻을 수 있습니다. –

+0

@pallandt 여기에 언급 된 단계를 사용하여 크롤링하는 새로운 Nutch입니다. https://sites.google.com/site/profileswapnilkulkarni/tech-talk/nutchtutorialonubuntu10easysteps 여기에서 언급했듯이이 예제를 추가하면 – jackyesind

관련 문제