2012-01-02 6 views
1

검색 쿼리를 기반으로 로컬 데이터베이스에서 문서를 찾는 검색 엔진을 찾고 있습니다. 이 프로세스는 웹 페이지를 포함하지 않습니다. 여기에는 일련의 텍스트 문서 (pdf 및 doc 파일) 만 포함됩니다. 이 프로세스에 대해 몇 가지 효율적인 검색 엔진을 제안하십시오.검색 엔진을 사용하여 로컬 데이터베이스에서 문서 검색

답변

1

나는 먼저 Solr (Lucene 위에 구축 됨)을 시도 할 것입니다. 멋진 웹 기반 관리 도구도 제공됩니다.

+0

위대한. 내 요구 사항은 쿼리를 입력하고 올바른 정확성을 가지고 로컬 데이터베이스에서 최상의 문서 집합을 얻는 것입니다. – siddharth

+0

Ambar http://ambar.rdseventeen.com/을 사용해보세요. 사용하기 쉽고 간단한 REST API를 가지고 있습니다. – SochiX

0

나는 Lucene/Lucene.Net을 제안하지만, 대체물은 herehere입니다.

+0

감사합니다. 그러나 이들 중 어느 것이 가장 효율적인지 알고 싶습니다. 그걸 도와 주실 수 있습니까? – siddharth

+0

귀하의 요구 사항을 모른 채 대답하는 것은 불가능합니다. 각 솔루션마다 고유 한 장단점이 있으므로 가장 효율적/최고의 솔루션입니다. – Kane

+0

내 데이터베이스에는 약 200 개의 텍스트 문서 (주로 pdf)가 있습니다. 그리고 내 작업은 참조 문서를 사용하여 많은 쿼리를 생성 한 다음이 쿼리를 사용하여 참조 문서와 가장 일치하는 문서를 검색하는 것입니다. 그래서 나는 많은 질문을하고 평균적인 정확성을 적어도 기대할 것입니다. – siddharth

1

도구

  1. Solr

    : 강력한 텍스트 검색 및 동적 클러스터링. 문서 예제를 사용해보십시오.

  2. Mahout : 인기 클러스터링 algos는 이미 존재에

  3. Lucene : 전체 기능을 갖춘 텍스트 검색 엔진 라이브러리 내 의견 SOLR에서

은 검색 목적을위한 최선의 선택이 될 것입니다 .

관련 문제