2012-05-18 4 views
0

문서 (PDF, XML, 웹 문서) 등을 색인하는 데 사용하는 도구가 무엇이 었는지 궁금합니다. 색인을 생성하고 구문 분석하고 결과를 적절히 반환 할 수 있기를 바랍니다.문서 인덱싱 및 구문 분석에 적합한 도구입니까?

나는 solr/lucene를 사용해 봤지만, 유용성을 충분히 찾지 못해 뭔가를 놓쳤을 것입니다.

+3

"보다 유용하다고 생각하지 못했습니다."보다 구체적으로 설명해야합니다. –

+0

Solr과 관련된 점은 인덱스를 만들 때 전체 문서를 큰 문자열로 인덱싱한다는 것입니다. 이것에 대한 검색 쿼리는 전체 문서도 반환합니다. 그 이후로 인덱스였던 분야였습니다. 텍스트 색인 내에서 색인을 생성하는 방법을 알 수 없었습니다. – 12rad

+0

기본적으로 나는 이 "content"필드에서 하나의 문자열 색인 생성. 그것은 문제입니다. 내 요구 사항은 내가 주위에 몇 줄과 함께 검색 문자열 반환하는 것입니다. – 12rad

답변

1

Solr 원하는대로 .... ElasticSearch는 옵션입니다.

관련 문제