2009-12-28 3 views
3

파일에서 텍스트를 검색하기위한 작은 애플리케이션을 만들기 위해 몇 가지 코드를 작성하려고합니다.검색 엔진의 색인이 반전합니다.

파일을 크롤링해야하며 검색을 향상 시키려면 색인을 반전해야합니다.

제 문제는 필자가 파서가 어떻게 될지에 대한 아이디어를 가지고 있다는 것입니다. 나는 AND, NOT, OR을 쿼리에 구현하려고합니다.

내 색인이 어떻게되어야 하는지를 알 수 없었습니다 ... 역 색인을 만든 적이 한번도 없었습니다. 누구든지 실현 가능한 방법을 제안 할 수 있다면 매우 감사하게 생각합니다. 이론적으로 어떻게 작동하는지는 알지만 내 문제는 MySql에서 어떻게 일어나는지 전혀 모른다는 것입니다. 나는 키워드가 너무 색인 된 색인을 부여해야합니다.

+2

수동으로 수행해야합니까, 아니면 Lucene (http://lucene.apache.org/)과 같은 기존 솔루션을 사용할 수 있습니까? –

답변

1

선택 1 : Apache Solr/Lucene. 선택 2 : mysql의 전체 텍스트 색인 지원.

+1

선택 3 : MySQL 또는 sphinx와 결합 된 XML 스트림 (http://sphinxsearch.com/) – chris

관련 문제