2012-06-21 2 views
1

나는 단지 Nutch and Solr을 시작하고 있습니다. 시드 URL 하나만 사용하여 크롤링을 한 번 실행했습니다.도움이 필요하십니까 Solr

bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5

모든 것이 잘 가고 나는 페이지 SOLR 인덱스를 있으리라 믿고있어 : 나는이 명령을 실행? 그러면 지금 어떻게 검색 하죠? 여기 갔다 로컬 호스트 : 8983/SOLR/관리/하지만 검색 쿼리를 넣어 때이 얻을 검색을 클릭 : 나는 또한 tutorial에서 예를 시도

HTTP ERROR 400 
Problem accessing /solr/select/. 
Reason: undefined field text 

하지만이 명령을 실행하면

나의 궁극적 인 목표는 어떻게 든에
SimplePostTool: version 1.4 
SimplePostTool: POSTing files to http://localhost:8983/solr/update.. 
SimplePostTool: POSTing file solr.xml 
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name' 

입니다

:

java -jar post.jar solr.xml monitor.xml

나는이 얻을 이 데이터를 Accumulo에 추가하고 검색 엔진에 사용하십시오.

답변

2

Nutch 1.4 이상을 사용한다고 가정합니다. 이 경우 solr/conf/schema.xml 파일에 추가 한 필드 유형을 따옴표없이 "text"에서 "text_general"로 변경해야합니다.

저는 지금도 비슷한 목표를 위해 노력하고 있으며, 적어도 solr이 색인 된 사이트를 검색 할 수는 없지만 solr이 제대로 작동하도록 수정했습니다. 희망이 있으면, 당신이 일하는 경우 알려 주시기 바랍니다.