2017-11-19 4 views
5

현재 SOLR에서 텍스트 콘텐츠를 색인 생성 한 프로젝트에서 작업 중입니다. 모든 콘텐츠는 하나의 특정 언어로 작성되었습니다 (우리는 유럽 언어 인 유럽 언어 4 가지를 사용합니다). 그러나 기본 검색 (사용자가 입력 한 검색 텍스트)이 많은 결과를 반환하지 않으면 우리도 검색을 시도합니다 다른 언어로 된 문서. 따라서 우리는 어떻게 든 쿼리를 번역해야합니다. 우리의 기본은 프로젝트 필드에서 일반적으로 사용되는 번역 된 단어의 매핑 목록을 가질 수 있다는 것입니다.Solr 다국어 검색

나에게 와서 한 가지 해결책은 동의어 검색 기능을 사용하는 것이 었습니다. 그러나 이것은 최상의 결과를 제공하지 못할 수도 있습니다.

사람들은이 다국어 검색 기능을 달성하는 데 도움이 될 수있는 기존 모듈에 대한 지침을 갖고 있습니까? 아니면 차가운 개념 아이디어를 조사하려고합니까? 그것은 다국어 검색처럼 보인다

감사

답변

3

는 고유 한 문제가되지 않습니다.

(& FQ를 http://lucene.472066.n3.nabble.com/Multilingual-Search-td484201.htmlSolr index and search multilingual data

두 링크가 각 언어에 대해 필드를 전담하는 것이 좋습니다 봐,하지만 당신은 언어를 알리는 필드를 가질 수 있습니다, 당신은 필터 쿼리를 추가 할 수 있습니다하세요 =) 귀하가 발견 한 언어 (사용자 쿼리로부터). 이것은 더 확장 가능한 해결책이라고 생각합니다.

+0

https://www.rosette.com/blog/indexing-strategies-for-multilingual-search-with-solr-and-rosette – cheffe

+1

http://smalldirector.github.io/solr-multilingual-analyzer – cheffe

1

옵션을 사용하면 인덱스 시간에 용어를 번역 할 수 있습니다. 응용 프로그램 수준에서 Solr 수준 또는 Solr보다 먼저 수행 할 수 있으며 번역 된 텍스트를 여러 필드에 저장하여 원하는 필드를 가질 수 있습니다. :

text_en: "Hello", 
text_fi: "Hei" 

그러면 text_en : Hello를 쿼리하면됩니다.

기본 언어 일치 점수를 높이려면 primary_language 필드가 있고 검색 언어와 일치하는 문서가 늘어납니다.