2012-04-10 4 views
0

나는 solr에 의해 설립 된 엔진을 사용하여 PMI에 관한 연구를하고 있습니다. 나는 코퍼스 (numofDocs가 아닌) 내의 키워드의 수를 얻고 싶다. 이것을 얻을 수있는 직접적인 방법이 있습니까? 다른 질문 : solr 시스템에서 논리 연산자 (예 : NEAR)가 포함 된 검색을 수행 할 수 있습니까? 또는 이와 비슷한 방법?solr : 전체 코퍼스에서 키워드 수를 얻으려면 어떻게해야합니까?

+0

"코퍼스 내의 키워드 수"는 무엇을 의미합니까? 분명히 해줄 수 있니? 특정 문서에 대해 일치하는 키워드의 수를 의미합니까? 또는 모든 문서에서 일치하는 키워드의 수가 반환 되었습니까? 또는 일치하는 문서의 총 키워드 수? –

+0

모든 문서에서 일치하는 키워드의 수를 의미합니다. – wensir

+0

아, 문서가 일치하는 경우 문서에서 얼마나 많은 단어가 검색과 일치했는지 알고 싶습니까? 일치하는 각 문서에 대해 동일한 작업을 수행합니까? 오히려 나는 직접적인 방법을 모른다. 여러분이 시도 할 수있는 것은'& hl.fragsize = 0' (전체 문서를 반환합니다!)와 함께 강조 표시를 사용한 다음 반환 된 데이터를 구문 분석하는 것입니다 (강조 태그 내 단어 경계 수를 1로 늘림). –

답변

2

NEAR은 "근접 검색"입니다.

field:"phrase of words"~10 

10 문구의 단어를해야합니다 얼마나 가까이 : SOLR의 형식은 "sloppy phrase queries"의 형태로 비슷한을 제공합니다.

+0

대단히 고마워요! – wensir

관련 문제