2017-02-13 2 views
1

특정 데이터를 토큰 화하는 응용 프로그램이 있습니다. 내가 가진 문제는 내가 토큰화할 필요가 있지만 쉼표로 구분 된 필드가 공백에 없다는 것입니다. 예를 들어 :Lucene Tokenizer - 공백 포함

"Age 6, Age 7, Age 8" 

Age 
6 
Age 
7 
Age 
8 

내가

Age 6 
Age 7 
Age 8 

특정 필드 만의 기본 동작을 변경하는 나를 위해 방법이 있나요이 필요되다?

내가 현재 가지고있는 구성 설정 :

<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO" 
boost="1f" type="System.String" 
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration, 
Sitecore.ContentSearch.LuceneProvider" /> 
+0

필드에 분석기를 지정해야합니다 (https://community.sitecore.net/technical_blogs/b/getting_to_know_sitecore/posts/understanding-analyzers-and-sitecore-7). 사용자 정의 분석기/분석기를 작성해야 할 수도 있습니다. 토크 나이저 .. – Gatogordo

답변

0

불행하게도, 나는 C 번호를 모르는,하지만 난 루씬을 알고있다. 따라서 필요한 동작을 위해 PatternAnalyzer을 사용해야합니다. 토큰 화에 사용될 정규 표현식을 지정할 수 있습니다. 귀하의 경우에는 \\,과 같은 패턴이 쉼표로 분리하여 작동해야합니다.