2014-09-17 5 views
1

나는 Lucene의 초보자입니다. 그것을 이해하는 과정에서 디렉토리의 파일을 성공적으로 색인화 할 수 있었고 특정 단어가 들어있는 파일 목록을 얻기 위해 기본 lucene 검색을 수행했습니다.Lucene- 단어 일치가 발생하는 문장을 추출

이제 검색 단어가있는 파일에서 문장을 추출하려고합니다. 많이 검색했지만 알아 내지 못했습니다.

감사합니다.

+1

에 대한 확인 루씬의 [형광펜] (http://lucene.apache.org/core/4_10_0/highlighter/org/apache/lucene/search/highlight/Highlighter .html). – femtoRgon

+0

Lucene의 형광펜은 문장을 추출 할 때 도움이되지 않습니다. –

+0

오해해서 죄송합니다. 나는 그것이 당신이 의미했던 것을 AR1 또는 나에게 분명하다고 생각하지 않는다. 대개 사람들이 일치하는 문장을 추출하라는 요청은 "google이하는 것과 같습니다."즉, 실제로는 문장이 아니라 텍스트 단편을 의미합니다. 그건 제쳐두고, 당신이 지금 당신의 문제를 해결 한 것 같은데, 그럴 경우 항상 [스스로 대답하십시오] (http://stackoverflow.com/help/self-answer)를 격려해주십시오! – femtoRgon

답변

1

답장을 보내 주셔서 감사합니다.

"relavent/best text/fragment"가 아닌 파일 디렉토리에서 문장 색인을 추출하려고했습니다. 다음 디렉토리 & 각 파일의 인덱스 문장> 첫 번째 인덱스 파일 - "2 단계 색인"을 사용하여
: 여기

내가 문제를 해결하는 방법입니다. 이것은 나의 일을 꽤 더 쉽게 만들었다 & 더 빠르다. 어쨌든

, 덕분에 다시 도움 :

0

당신은 방법을 찾고

org.apache.lucene.search.highlight.Highlighter.getBestFragment

이러한 방법은 입력의 원본 텍스트를 분석 생성 된 토큰 세트 및 수익률을 얻는다 가장 관련있는 텍스트 조각을 출력합니다. 조각이 너무 큰 경우 조각을 다듬어야합니다.