2014-05-12 2 views
0

으로 모든 문서를 찾을 수있는 solr 싶습니다. 토큰 화기는 해시를 제거하고 c 만 남기 때문에 c가있는 모든 문서를 보여줍니다. 나는 해쉬 마크의 줄무늬를 어떻게 멈추는 지 알고 싶었다. 다른 토크 나이저를 작성해야합니까? 아니면 더 간단한 솔루션이 있습니까?그냥 C#

답변

0

매우 쉬운 일이며이를 달성하는 데는 여러 가지 방법이 있습니다. 시작하기 전에 Solr 애널라이저 등에 대한 지식을 닦으라고 다음 기사를 참조하도록 권합니다.

귀하의 질문에 대답하기 위해, 당신은 ... ... 필드 그렇게 모양을 분석하기위한 WhitespaceTokenizerFactory를 사용 SOLR 스키마의 fieldtype을 정의하여 "#"문자의 제거를 위해 중지 할 수 있습니다

<fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100"> 
    <analyzer> 
    <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
    </analyzer> 
</fieldType> 

자세한 내용은 다음 문서를 참조하십시오.

  1. https://cwiki.apache.org/confluence/display/solr/Understanding+Analyzers%2C+Tokenizers%2C+and+Filters
  2. Solr search for hashtag or mentions