최근 장고가있는 사이트에 사용자가 키워드를 사용하여 직원을 검색 할 수 있도록 검색 기능을 추가했습니다. 사용자가 처음에 이력서를 업로드하면이를 텍스트로 변환하고 정지 단어를 제거한 다음 텍스트를 해당 사용자의 TextField에 추가합니다. 나는 Django-Haystack을 Whoosh 검색 엔진으로 사용했습니다. 아마 사용하지 것이다 추가 기능에서 제외Django Haystack substring 검색
세 things-
1), SOLR 또는 Xapian로 전환에 대한 구체적인 장점이있다?
2) 이력서를 텍스트로 변환 할 때 본질적으로 pdf를 직접 색인화합니다. 그러나 Xapian과 Solr 모두 .pdf 인덱싱을 지원한다는 것을 알고 있습니다. 그러나 Haystack의 외형은 아닙니다. 이 문제를 해결하는 방법에 대한 도움말? 아니면 계속 색인을 생성해야합니까? 그렇다면 단순히 키워드 텍스트 파일을 제공하는 것 이상의 일을해야합니까?
3) 키워드가 정확하게 일치하면 Whoosh 만 결과를 반환합니다. 사용자가 '수학'을 키워드로 사용하고 '수학'을 검색하면 해당 사용자를 표시하고 싶습니다. 나는 Xapian이나 Solr이 이것을 지원하는지 확실하게 말할 수 없었다. 생각?
의견을 보내 주셔서 감사합니다. 나는 당분간이 자신을 파고들 것이다.
질문에 대한 답변을 찾으셨습니까? 우리와 함께 공유하고 싶습니까? – Armance