2010-07-21 3 views
2

lucene 점수를 PageRank와 결합하려고하는데 DefaulySimilarity를 ​​수정하여 이미있는 PageRank (해당 URL이있는 Array에서)를 추가하려고했지만 문제는 문서 필드를 가져 오는 방법을 모르는 것입니다. 문서의 URL을 저장합니다. docD라는 용어는 docID 만 반환 할 수 있습니다. 또는 또 다른 아이디어는 TopScoreDocCollector를 수정하는 것입니다.이 메서드는 collect (int docid)라는 이름의 메서드를 가지며 또한 docid가 주어졌지만 여전히 저장된 필드를 가져 오는 방법을 모릅니다. 누구든지 문서 ID로 문서의 저장된 필드를 가져 오는 방법에 대한 아이디어를 얻었습니까? 또는 lucene과 PageRank를 결합하는 방법에 대한 아이디어가 있습니까? 고맙습니다.lucene의 문서 ID로 문서의 저장된 필드를 얻는 방법은 무엇입니까?

답변

2

내부 Lucene ID로 Lucene의 저장된 필드 값을 가져 오려면 IndexReader.document (int n)를 사용하십시오. 자신의 UID가 인덱싱 된 경우 해당 용어로 검색하고 Lucene ID를 가져온 다음 IndexReader.document (int n)를 호출해야합니다.

PageRank를 계산 중입니까? 너라면 나에게 미친 것처럼 보인다. 일반적으로 PageRank는 실행되는 일괄 처리이며 인덱싱 시간 동안 각 문서에 할당 된 정적 PageRank 점수가 부스트로 추가됩니다.

관련 문제