0
내 인덱스와 쿼리가 정확히 같은 문제가 있지만 결과가 반환되지 않습니다. ENGTF 최대 길이보다 긴 단어는 실패하는 것 같습니다. 여기 내 스키마가있다. "만족"이 인덱스에 투입하고, "만족"이 쿼리에 투입 될 때 여기에 텍스트가 디버거에서 일치하지만 결과가 반환되지 않습니다.
<fieldType name="text_en_splitting" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="lang/stopwords_en.txt"
enablePositionIncrements="true"
/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" stemEnglishPossessive="0" preserveOriginal="1" types="wdfftypes.txt" protected="protwords.txt"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
<filter class="solr.ASCIIFoldingFilterFactory" words="mapping-FoldToASCII.txt"/>
<filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="10" side="front"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
<filter class="solr.ASCIIFoldingFilterFactory" words="mapping-FoldToASCII.txt"/>
</analyzer>
</fieldType>
는 분석기의 스크린 샷이다.
어떤 아이디어가? 감사합니다.
정확 하 게 그건 내 마지막 해결 방법이었습니다. 나는 그것이 반드시 필요하지 않아야하는 해결 방법이기 때문에 그것을 피하려고 노력했다. – Tanner
정말 큰 해결 방법은 아닙니다. 입력을 두 가지 다른 방법으로 처리하고자 할 때 사용하는 것은 매우 보편적 인 기술입니다. 단순한 n-gram 필터를 원했던 사람들은 원하는대로 전체 토큰을 일치시키기 시작하면 다소 좌절 할 수 있습니다. – Kevin