2010-11-22 4 views
2

Nutch를 사용하여 사이트를 색인화했으며 이제 Zend Lucene 라이브러리를 사용하여 색인을 검색하고 있습니다.Zend lucene 콘텐츠 필드

저는 실제로 Zend 라이브러리를 Codeigniter로 가져 왔지만 모든 Zend가이 작업을 수행하고 있습니다.

제목, 점수 및 URL을 잘 표시 할 수 있지만 페이지의 콘텐츠를 표시 할 필드 이름을 찾을 수 없습니다.

은 지금까지 나는

$index = new Zend_Search_Lucene('C:\nutch\nutch-0.9\my-search\index'); 

$query = $this->input->post('searchQuery'); 

$hits = $index->find($query); 

echo "<p>Index contains " . $index->count() . " documents.</p>"; 

echo "<p>Search for '" . $query . "' returned " . count($hits) . " hits</p>"; 

foreach ($hits as $hit) 
{ 

    echo "<h4>" . $hit->title . "</h4>"; 

    echo "<p><b>Score:</b> " . sprintf('%.2f', $hit->score) . "</p>"; 

    echo "<p><b>Url:</b> " ."<a href='" . $hit->url . "'>" . $hit->url. "</a></p>"; 

} 

사람이 내용이나 콘텐츠의 요약을 표시 할 필드의 이름으로 도울 수있는 다음과 같은 코드가?

감사

+0

Windows에서도 경로에 백 슬래시를 사용하지 마십시오. 항상 슬래시를 사용하십시오. PHP와 실제로는 Windows API 함수도이를 이해합니다. 백 슬래시를 사용할 때는 반드시 이스케이프 처리해야합니다! \ n은 작은 따옴표로 묶은 문자열의 개행 문자가 아니지만 이스케이프 처리되지 않은 백 슬래시를 사용하는 것은 여전히 ​​지저분합니다. – ThiefMaster

+0

감사합니다. 이것은 로컬 컴퓨터의 테스트 단계에만 있으며 현재 프로덕션 준비가 된 코드 근처에 있습니다. 슬래시가있는 경우에도 색인 필드 이름 문제를 해결하지 못합니다. – ianckc

+0

작동시킬 수 있었습니까? Nutch와 색인을 작성하고 Zend Lucene과 함께 읽는 색인 버전 문제가 있었습니까? – haknick

답변

2

은 내가 nutch 인덱스 형식을 잘 모르겠지만, 나는 루씬 인덱스를 확인해야 할 때마다 나는 그것은 당신이, 인덱스 디렉토리를 열 필드를 검색하고 쿼리를 실행할 수 있습니다 Luke - Lucene Index Toolbox

를 사용합니다. 익숙하지 않은 색인을 사용하는 경우 매우 유용합니다.

+0

링크를 제공해 주셔서 감사합니다. 저는 루크를 아주 짧게 보았습니다. 그리고 그것은 제가 찾고있는 것과 같습니다. – ianckc

관련 문제