2013-09-27 2 views
1

fieldtype이 text_ws 인 문서 필드에 밑줄 구분 및 낙타 값 (eq "SimplyShopping_Rediff")이 있습니다.solr 쿼리 분석기 밑줄

다시 인덱싱하지 않고도 쿼리 분석기를 변경하여 쇼핑이나 Rediff에서 검색 할 수있는 방법이 있습니까?

+0

당신이 'text_ws'를 solr 샘플의 필드 유형이라고 부르는 것입니까? 그렇지 않다면 게시 할 수 있습니까? – cheffe

+0

<분석기 TYPE = "인덱스"> \t <토크 나이저 클래스 = "solr.PatternTokenizerFactory"패턴 = ";" /> \t <필터 클래스 = "solr.LowerCaseFilterFactory"/> <분석기 TYPE = "쿼리"> \t <토크 나이저 클래스 = "solr.PatternTokenizerFactory"패턴 = ";" /> \t Deepak

답변

0

아니요, 귀하의 경우는 아닙니다.

정의한 fieldType은 ;을 사용하여 텍스트를 토큰 화합니다. 텍스트의 토큰 화 란 단어 스트림을 색인 토큰 (용어 또는 단어라고도 함)으로 분할하는 것을 의미합니다. 전체 텍스트가 하나 토큰으로 인식되고 색인에 정확히 표시로 이동합니다 있도록

귀하의 예를 SimplyShopping_Rediff에 머무는, 그 안에 더 ;이 없습니다. 대문자, 소문자, 줄기 또는 필터 일지 모르지만 더 이상 분할 할 수 없습니다.

fieldType을 변경하더라도 쿼리시 원하는 방식으로 토큰 화합니다. 색인 내의 토큰은 색인 시간에 이미 잘못된 방법으로 토큰 화되었으므로 여전히 결함이 있습니다. 이와 같이 정확한 새 토큰 화 된 검색어는 색인에서 아무 것도 기록하지 않습니다. 색인에 히트가 없으며 검색 결과가 없습니다.

solr 참조 가이드는 a good section about Analyzers, Tokenizers and Filters입니다. 아마도 전체 인덱스를 다시 작성하는 데 매우 많은 비용이 들기 때문에 먼저이 인덱스를 읽는 것이 좋습니다.