2012-12-03 3 views
1

필터를 사용하여 필드의 데이터를 바꿀 수 있습니까?Solr에서 새 필드의 데이터를 바꿀 수 있습니까?

데이터를 가정하십시오.

<doc> 
    <field name=id>1</field > 
    <field name=contents>a article about specific subject</field> 
</doc> 

는 내가 카테고리 필드 내용 필드를 복사

<copyField source="contents" dest="category"/> 

종류 필드는 필터가 있습니다.

<field name="category" type="myType" stored="true" /> 

<fieldType name="myType" class="solr.TextField" positionIncrementGap="100"> 
    <analyzer type="index"> 
    <tokenizer class="myTokenizer"/> 
    <filter class="myFilter"/> 
    </analyzer> 
</fieldType> 

나는 그것이 범주이 문서를 분류하고 넣어 원하는 결과이 좋아하는 '긍정적', 필터를 사용하여 범주 필드에 '부정적'. 이미 LDA를 사용하여 범주를 지정하기 위해 myFilter라는 개체를 구현했으며이 개체는 이미 정의 된 항목 모델을 사용합니다.
원본 데이터를 범주 필드의 결과로 대체하려면 어떻게합니까? 가능한가?

답변

0

Tokenizers가 Reader를 가져 와서 토큰 화하고 필터링 할 수 있어야합니다.
입력이 토큰 화되지 않도록 KeywordTokenizer를 사용할 수 있으며 Category 필드를 채우기 위해 내용의 언어를 확인하는 필터를 설계 할 수 있습니다.

developing-your-own-solr-filter

현재 내용을 LDA 결과로 바꾸면됩니다.

관련 문제