2014-11-24 3 views
3

nutch2.2.1을 (를) 사용하고 있습니다. 로그 파일이 다음 오류를 생성 중입니다오류 Nutch 'http.agent.name'에 나열된 상담원 없음

오류 프로토콜입니다 .RobotRulesParser - 우리가 광고하는 에이전트 (nutch-spider-2.2.1)가 'http.robots.agents'속성에 처음 나열되지 않았습니다!

내 nutch-site.xml 파일은

<property> 
<name>http.agent.name</name> 
<value>nutch-spider-2.2.1</value> 
</property> 

내 nutch-default.xml에 실제 문제가

<property> 
<name>http.agent.name</name> 
<value></value> 
</property> 

입니다 (위의 속성)입니까? 명확하게 안내하십시오 (적절히 설명하십시오). 이 질문은 게시 게시 here하지만 나는이 질문에 (필요하다면) 그것이 다시 게시 이유입니다.

답변

3

"http.robots.agents"의 속성을 추가하고 http.agent.name의 값을 첫 번째 에이전트 이름으로 지정하고 default *를 list.just 다음과 같이 유지합니다.

<property> 
    <name>http.robots.agents</name> 
    <value>nutch-spider-2.2.1,*</value> 
</property> 
+0

감사합니다. 저에게 도움이되었습니다. – Shafiq