kstemmer 및 prot

친구,kstemmer 및 prot

나는 현재 응용 프로그램에서 형태소 분석 작업을 수행하기 위해 KStemmer를 사용하여 solr로 개발합니다. 무엇을 발견하는 것은 우리가 kStemmer를 사용하는 경우, 그것은 보호로 그것은 protwords에 단어를 복용하지 않는 protwords.txt

<analyzer type="query"> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
    <filter class="solr.StopFilterFactory" 
      ignoreCase="true" 
      words="stopwords.txt" 
      enablePositionIncrements="true" 
      /> 
    <filter class="solr.LowerCaseFilterFactory"/> 
<filter class="solr.EnglishPossessiveFilterFactory"/> 
    <filter class="solr.KStemFilterFactory" protected="protwords.txt"/> 

    </analyzer>

를 참가하는 것입니다. 이것이 Kstem의 작동 방식입니까?

출처

2012-10-03 jeyaprakash

소스 코드를 확인했지만 구현을 볼 수 없습니다 .Btw, Solr 3.6의 소스 코드를 확인했습니다.

SnowballPorterFilterFactory에는 구현되지만 KStemFilterFactory에는 구현되지 않습니다.

출처

2012-10-03 11:54:18

KstemFilterFactory에서 구현할 수 있습니까? – jeyaprakash

KstemFilterFactory와 SnowballPorterFilterFactory를 결합한 자체 필터 팩토리를 구현할 수 있습니다. –

kstemmer 및 prot

답변

관련 문제