2011-11-29 2 views
1

내 Django 애플리케이션은 다른 Postgres DB, 즉 장고의 DB와 다른 대량의 채팅 로그를 검색 할 수 있어야합니다. 초기에 사이트의 사용자는 간단한 전체 텍스트 검색 로그를 사용하지만 나중에 NLP를 사용하여 이러한 로그를 구문 분석하려고합니다.채팅 로그 색인 생성 및 장고 검색

이 경우 더 나은 색인 옵션은 무엇입니까? - 스핑크스 또는 Solr?

포스 (FOSS)이고, 비늘이 잘 보이고, NLP를 지원하며, 좋은 파이썬/장고 바인딩을 가지고 있습니다.

죄송합니다. 위의 내용이 잘못 되었다면 죄송합니다. 나는 이와 같은 것을 구현하는 개념에 익숙하지 않고 가능한 한 빨리 이들을 가장 잘 파악하려고 노력하고 있습니다.

답변

0

완벽하게 구현할 수는 없지만 전체 텍스트 검색을 원할 경우 명확한 대답은 오픈 소스 구현이 진행되는 한 Solr/Lucene입니다. 주의 사항 : 저는 Solr을 Python과 함께 사용하지 않으며 Sphinx를 사용한 적이 없습니다.

파이프 라인은 db의 로그를 읽고 인덱싱하고 서버에 인덱스를 저장 한 다음 검색하는 것과 비슷합니다.

추가/맞춤 NLP 항목을 Lucene 인덱서에 추가하는 것은 매우 쉽습니다.

thread comparing Lucene and ElasticSearch은 가치가있을 것입니다.