2017-10-13 1 views
0

solr에서 회사를 검색 할 때 com pany, comp-any 및 company와 같은 유사한 결과가 포함되어야합니다. solr을 사용하여 얻는 방법.solr에서 proximity search를 개선하는 방법

+0

이미 무엇을하려고 않은 : 그래서, 여기

그것에 대해 예제와 함께 유용한 정보입니다 :) 사용하는 필드 현명하게 선택? – Mysterion

+0

"비슷한 결과"라고 생각하는 것에 대한 규칙은 무엇입니까? – MatsLindh

+0

내가 월마트를 검색하면 그 결과에는 월마트, 월마트, 월마트가 표시되고 그 반대의 경우가 표시됩니다. – Savitha

답변

0

제공 한 사용 사례의 경우 n 그램을 사용할 수 있습니다. "COM", "OMP", "MPA" "팬":

<analyzer> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.NGramFilterFactory" minGramSize="3" maxGramSize="7"/> 
</analyzer> 

이 필터는 다음 토큰을 생성합니다, 단어 "회사"에 대해, 지정된 크기 등의 부분에서 토큰을 나누기 compan, ompany, compan, ompany, company "

TAKE CARE이 필터는 성능을 저하시키고 색인을 기하 급수적으로 증가 시키며 사용중인 필드의 크기 (즉, 내용 추출에 사용하는 경우)에 따라 Solr을 메모리 부족으로 실행할 수 있습니다. 이 https://lucene.apache.org/solr/guide/6_6/filter-descriptions.html#FilterDescriptions-N-GramFilter