2012-11-09 7 views
0

저는 Solr and Nutch에 있습니다. solr/nutch schema.xml의 필드 매핑에 대한 질문이 있습니다. 나는 solr/nutch 픽업이 나의 웹 사이트 중 하나에서 몇몇 키워드를 원한다. schema.xml에는 필드 매핑 섹션이 있으므로이 작업을 수행 할 수 있습니다. 내가 알고 싶은 것은 키워드 필드를 HTML에 어떻게 넣어야합니까? 해야 난 단지 했나 HTML은 숨겨진 필드 :HTML 용 필드 매핑

<input type="hidden" name="keyword" .... /> 

아니면이

<meta/> 

태그를 사용해야합니까?

답변

1

extracting element from HTML by XPATH에 대한 작업이 있었기 때문에이를 확인할 수 있습니다.

그러나 메타 태그를 사용하면 HTML 페이지가 일반적으로 xpath 표현식에 적합하지 않기 때문에 더 나은 옵션이 될 수 있습니다. Nutch와 함께 Index Metatags을 사용하여 메타 태그를 추출하고 Solr의 입력란을 채울 수 있습니다.

+0

감사합니다. "Index Meatags"는 훌륭하게 작동합니다! – user1773304