2013-08-06 2 views
0

현재 검색 엔진을 구축해야하는 프로젝트가 있지만 포럼에서 검색하는 동안 Solr, nutch 및 lucece, tho 만 사용할 수는 없습니다. Nutch를 말하는 사람들이 많이 있습니다. 색인 생성을 수행 할 때 nutch (1.4)를 설치하고 데이터를 크롤링했지만 색인 폴더 나 이와 유사한 데이터가있는 것을 깨달았습니다. 따라서 크롤링 된 데이터 만 알 수 있습니다. 색인 생성 및 검색?Nutch에 대한 기본적인 의문

추신. 이 프로젝트에서는 Solr을 사용하지 않습니다. 순수한 nutch와 lucene 만 사용할 수 있습니다. Java를 사용하여 모든 것을 구축해야하므로 사람들이 Nutch가 사실 인덱스라고 말하면서 정말 혼란 스럽습니다 ... 제 영어는 유감 스럽지만 제 모국어가 아닙니다. ...

답변

0

Lucene은 Nutch의 색인 생성 및 검색에 사용됩니다. Nutch를 이해하면 색인 생성을 위해 Lucene이 찾은 페이지를 전달합니다.

0

Nutch는 데이터를 색인하지 않으며 Lucene을 사용하지 않으므로 자체 색인을 만들 수 없습니다. Nutch는 색인을 생성하기 위해 Solr에게 문서를 전달해야합니다.

체크 아웃 : nutch vs solr indexing