2011-10-18 3 views
0

예를 들어 다음 텍스트를 색인화하려고 할 때 Lucene.NET을 사용하고 있습니다. "범주 T (모두 검은 색 바탕에 표시/기호로 그려져 있음)은 영구적으로 사용할 수 없습니다."Lucene.NET에서 한 단어로 색인을 생성합니까?

텍스트가 굵게 표시되어 있습니다. 모든 것이 상당히 잘 색인되지만 T는 무시됩니다.

누군가이 문제/문제점을 알고 있습니까? 다음 구문을 사용하고 있습니다.

doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED)); 
+0

더 많은 코드를 표시하십시오. –

답변

0

"T"는 표준 분석기에서 기본적으로 정지 단어입니다. 분석기를 만들 때 자신 만의 정지 단어 목록을 제공 할 수 있습니다.

StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/}); 

과 연동하고 검색하는 동안 그것을 사용 :

그냥 같이 분석기를 만들 수 있습니다.

+0

StandardAnalyzer를 사용하고 루크 도구를 사용하여 T가 색인에 있는지 확인합니다. 나는 "categorie T"에 대한 정확한 단어 조합 검색을 수행하며 아무 것도 발견되지 않습니다. – wsplinter

+0

@wsplinter 위의 해결책을 확인하십시오. – Dmitriy

+0

아니요 'T'는 중지 단어가 아닙니다. –

관련 문제