2012-08-01 4 views
0

이 제목을 어떻게 말로 써야할지 잘 모르겠습니다. 기본적으로 '애니'를 검색 할 때 '동물'을 찾지 만, '애니 마'를 검색하면 아무것도 찾지 않습니다. 그런 다음 '동물'을 검색하면 다시 '동물'을 찾습니다 ...Solr - 단어 중간에 결과가 중지됨

'애니 마'에서 효과가없는 이유는 누구입니까? 대부분의 단어에 대해 발생하는 것으로 보이지만 다른 문자 (예 : 'eleph'와 'elephan'은 괜찮지 만 'elepha'는 아무 것도 반환하지 않습니다.

검색어 1 (좋아)

/SOLR/선택 FQ = 유형 : : 태그 & Q = 이름 : ANIM

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">1</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:anim</str> 
</lst> 
</lst> 
<result name="response" numFound="1" start="0"> 
<doc> 
<int name="id">1</int> 
<str name="name">Animals</str> 
<arr name="name_auto"> 
<str>Animals</str> 
<str>Animals</str> 
</arr> 
<date name="timestamp">2012-08-01T08:16:38.789Z</date> 
<str name="type">tag</str> 
<str name="unique_id">tag_1</str> 
</doc> 
</result> 
</response> 

여기

는 쿼리와 결과입니다 검색어 2 (알맞지 않음)

/solr/select? fq = type : tag & Q = 이름 : 애니 마

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">1</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:anima</str> 
</lst> 
</lst> 
<result name="response" numFound="0" start="0"/> 
</response> 

쿼리 3 (좋아)

/SOLR/선택 FQ = 유형 : 태그 & Q = 이름 : 동물

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">0</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:animal</str> 
</lst> 
</lst> 
<result name="response" numFound="1" start="0"> 
<doc> 
<int name="id">1</int> 
<str name="name">Animals</str> 
<arr name="name_auto"> 
<str>Animals</str> 
<str>Animals</str> 
</arr> 
<date name="timestamp">2012-08-01T08:16:38.789Z</date> 
<str name="type">tag</str> 
<str name="unique_id">tag_1</str> 
</doc> 
</result> 
</response> 

편집 1 :

필드 정의

<field name="name" type="text" indexed="true" stored="true" required="true" /> 

fieldType :

<fieldType name="text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true"> 
     <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <!-- in this example, we will only use synonyms at query time 
     <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> 
     --> 
     <!-- Case insensitive stop word removal. 
      add enablePositionIncrements=true in both the index and query 
      analyzers to leave a 'gap' for more accurate phrase queries. 
     --> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="stopwords.txt" 
       enablePositionIncrements="true" 
       /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
     <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="stopwords.txt" 
       enablePositionIncrements="true" 
       /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
     <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> 
    </fieldType> 

편집 2 : 분석기하지만

전달 문자열 :

+1

이것은 아마도 형태소 분석 때문일 수 있습니다. anim, anima 및 animal이라는 단어를 분석 상자에 입력하고 어떻게 변형되는지 확인하십시오. 검색 구문 뒤에 별표를 추가하지 않으므로 와일드 카드 검색이 아닙니다. – Ansari

+0

솔라 스키마에서'name' 필드 정의 (그리고 관련된 fieldType)를 게시 할 수 있습니까? – javanna

+0

@ javanna - 위의 편집 1을 참조하십시오.안사리, 위의 편집 2 참조. – noel

답변

1

는, 문제는 형태소 분석 때문이다. 게시 한 Solr 스키마는 PorterStemFilterFactory을 사용하고 있기 때문에 증명됩니다. 부분 단어를 검색하려면 사용중인 쿼리 파서에 따라 와일드 카드 쿼리를 사용해보십시오. SOlr 3.x를 사용하고 있다면 너무 느리고 Solr 4.x는 많이 개선되었습니다. 이 animals과 일치하도록 EdgeNGrams을 만들 수도 있습니다.

+0

고마워, 잘 했어! – javanna

관련 문제