2011-09-13 2 views
2

synonyms.txt 파일에 맞춤법이 틀린 단어와 수정 된 단어 목록이 있습니다. 맞춤법 추천을 위해 solr에서 어떻게 사용할 수 있습니까?solr의 synonyms.txt에서 맞춤법 추천을 얻는 방법은 무엇입니까?

synonyms.txt는 다음과 같은 항목이 포함되어

laptap => laptop 
delll => dell 

내가 SOLR 서버에 "laptap"를 쿼리, 내가 같은 "? : 노트북을하셨습니까"제안을 얻어야한다.

는 내가의 schema.xml는 다음과 같이 알고 :

<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true"> 
<analyzer type="index"> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.StandardFilterFactory"/> 
</analyzer> 
<analyzer type="query"> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.StandardFilterFactory"/> 
</analyzer> 
</fieldType> 

무엇 solrconfig.xml 어떻습니까? 이미 목록이 있으므로 색인을 사용하고 싶지 않습니다. 어떤 생각?

답변

2

업데이트 플랫 파일에서 인덱스/사전을 생성하지의 요구 사항을 수용하기 :

  1. 원하는 동작을 가지고
  2. Implement a Custom SpellCheckComponent SOLR 3.1에 추가 된 Suggester 기능에서 봐 (나는 Suggester가 당신이 원하는 것에 가깝다고 생각한다.)

이전 제안 : 여기

파일을 기반으로 맞춤법 검사 구성하는 방법을 포함 SOLR에서 맞춤법 검사를 설정하기에 좋은 기사입니다. 이 작업을 수행하고 샘플 구성의 spellings.txt 파일을 synonyms.txt 파일로 바꿀 수 있어야합니다.

Getting started Spell Checking with Apache Lucene and Solr

+0

FileBasedSpellChecker 생성하고 철자 사전 인덱스를 만드는 것과 동일한 플랫 파일을 기반으로 사용한다. 맞춤법이 잘못된 단어를 수정 된 단어에 매핑 했으므로 색인에서 검색하지 않고 이러한 매핑을 사용하고 싶습니다. FileBasedSpellChecker를 사용하여 제안을 위해 내 파일을 사용하는 방법을 잘 모르겠습니다. – qwerty

+0

FileBasedSpellChecker가 플랫 파일에서 맞춤법 사전을 만드는 것을 인식하지 못했습니다. –

관련 문제