2010-08-08 5 views
7

최근 장고가있는 사이트에 사용자가 키워드를 사용하여 직원을 검색 할 수 있도록 검색 기능을 추가했습니다. 사용자가 처음에 이력서를 업로드하면이를 텍스트로 변환하고 정지 단어를 제거한 다음 텍스트를 해당 사용자의 TextField에 추가합니다. 나는 Django-Haystack을 Whoosh 검색 엔진으로 사용했습니다. 아마 사용하지 것이다 추가 기능에서 제외Django Haystack substring 검색

세 things-

1), SOLR 또는 Xapian로 전환에 대한 구체적인 장점이있다?

2) 이력서를 텍스트로 변환 할 때 본질적으로 pdf를 직접 색인화합니다. 그러나 Xapian과 Solr 모두 .pdf 인덱싱을 지원한다는 것을 알고 있습니다. 그러나 Haystack의 외형은 아닙니다. 이 문제를 해결하는 방법에 대한 도움말? 아니면 계속 색인을 생성해야합니까? 그렇다면 단순히 키워드 텍스트 파일을 제공하는 것 이상의 일을해야합니까?

3) 키워드가 정확하게 일치하면 Whoosh 만 결과를 반환합니다. 사용자가 '수학'을 키워드로 사용하고 '수학'을 검색하면 해당 사용자를 표시하고 싶습니다. 나는 Xapian이나 Solr이 이것을 지원하는지 확실하게 말할 수 없었다. 생각?

의견을 보내 주셔서 감사합니다. 나는 당분간이 자신을 파고들 것이다.

+1

질문에 대한 답변을 찾으셨습니까? 우리와 함께 공유하고 싶습니까? – Armance

답변

6

그러나 불행하게도 3 번 째를 제외하고는 다른 질문에 답할만큼 충분하지 않습니다. Whoosh는 실제로이를 지원합니다.

SearchQuerySet의 자동 완성 기능을 사용해야합니다.

여기에 상세 : 나는 현재 부분에 붕과 일치를 사용하고 http://docs.haystacksearch.org/dev/autocomplete.html

자신을 일치합니다.

관련 문제