2012-02-03 3 views
0

Solr, Tika을 설치 및 구성했으며 인덱싱 및 검색 문서를 사용해 보았습니다. 지금까지 모든 것이 잘 작동했습니다. 그러나 유니 코드에는 문제가 있습니다 (물론 :)). Red Star (Црвена звезда) 축구 클럽에 대한 유니 코드 텍스트로 문서를 색인했습니다. 이 기사를 검색하려고 할 때 "Црвена"또는 "звезда"를 입력하면 Solr은 올바른 문서를 찾습니다.Solr 및 유니 코드

어떻게이 단어들 (또는 다른 키릴 어 단어들)에 대한 동의어 목록을 만들 수 있습니까? "звезде", "звезду"등을 입력해도 Solr이 문서를 찾을 수있게하려면 무엇을해야합니까?

최저

, Joksimovic

답변

0

SOLR는 interface for synonyms뿐만 아니라 SpellCheckComponent 제공합니다.

그러나 문제는 실제로 유니 코드 문제와 관련이 없습니다.

+0

답변 해 주셔서 감사합니다. 이 단어들을 synonyms.txt에 추가하려고 시도한 후에 동의어를 정의한 단어를 찾을 수 없었습니다. 예를 들어,이 파일에 "звезде", "звезду", "звездa"를 넣었으며 "звезде"도 찾을 수 없었습니다. 그 전에 찾을 수있었습니다. 문제가 될 수있는 것이 무엇인지 아십니까? – Srecko

+0

따옴표없이','로 분리하십시오. 스키마에 synonymfilterfactory도 지정 했습니까? – fyr

+0

예, 따옴표없이 a로 구분됩니다. 나는 동의어 여과 능력을 지정했다고 생각 하나,이 순간에는 확인할 수 없다 ... 나는 그 사실을 잘 모르겠다. – Srecko