2012-11-17 5 views
8

nutch 및 solr으로 작업을 시작했으며 Nutch와 Solr을 통합하는 데 문제가 있습니다. 사용 http://wiki.apache.org/nutch/NutchTutorial 이후 :Nutch에서 크롤링 한 solr 데이터의 색인 생성 중 오류가 발생했습니다.

java.io.IOException: Job failed!

및 SOLR 보여주고있다 :

SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'

가 나는 이유에서 누락 된 '호스트'란있을 수 있다는 생각 bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 nutch는 메시지가 표시 나는이 튜토리얼을 따라 $ SOLR_HOME/example/solr/conf/schema.xml이 있지만 거기에 있습니다. 나는 당신의 도움에 매우 감사 할 것입니다.

+3

Nutch 스키마를 SOLR로 복사 했습니까? cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/example/solr/conf/ –

+0

예, 복사했습니다. – user1831647

+2

호스트가 스키마에 정의되어 있는지 확인하십시오. 그만해라. 데이터 디렉토리를 제거하십시오. Solr을 시작하십시오. 다시 시도하십시오. –

답변

2

Nutch 측에서 구성을 변경해도 Solr 스키마에 영향을주지 않습니다. Solr의 schema.xml에 해당 필드를 정의해야합니다.

관련 문제