2012-02-23 2 views
3

내가 신축성있는 검색을 사용할 때 먼저 색인을 붙여야합니다. 이 과정에서 난 맹목적으로 "SNOWBALL" , "KEYWORD" 분석기 coloumn을 사용하고 있습니다. 분석기의 주요 용도는 무엇입니까 (부스터라는 것을 알고 있습니다). 탄력적 인 검색에서 도움이됩니다. n "눈싸움"이라는 키워드는 무엇을 의미합니까?탄성 검색에서 키워드 "눈덩이"란 무엇입니까?

 
'data.description': {'analyzer': 'snowball', 'type': 'string'}, 
'data.title': {'analyzer': 'snowball', 'type': 'string'} 

답변

7

분석기 색인 주어진 텍스트에서 색인 용어를 추출하는 과정이다.

텍스트에서

예를

를 들어이가 "중지 단어"분석기 만 공룡, 현대 나이 키워드는 인덱스에 저장됩니다에 대해 분석된다 "나는 현대 시대에서 공룡이다". 즉, "am"을 검색하면 색인 된 텍스트에 단어가 있지만 색인 된 문서를 가리 키지 않습니다. https://www.elastic.co/guide/en/elasticsearch/reference/2.4/analysis-snowball-analyzer.html

0

눈덩이 필터가 특정 형태소에 기초하여 단어를 막기 위해 사용된다 -

마찬가지로 눈덩이는 스톱 워드, 소문자 표준 분석의 조합이다. 스 트리머는 단어의 적절한 줄기를 결정하기 위해 몇 가지 규칙을 사용합니다. 그 의미 다른 stemmers 다른 결과를 반환 할 수 있습니다.

예를 들어 "색인 생성", "색인 생성 가능", "색인 생성", "색인 생성"등의 단어는 "색인"으로 사용되지 않습니다. "문자열 색인화"를 검색 할 때 제목이 "내 문자열 색인화 가능"이라는 문서를 검색하는 것이 특히 좋습니다. (c)

는이 필터 https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-snowball-tokenfilter.html

P.S. 참조 configurate하려면 http://snowball.tartarus.org/ | http://snowballstem.org/

관련 문제