Lucene 실시간 인덱싱을 구현하는 가장 좋은 방법은 무엇입니까?Lucene 실시간 인덱싱?
답변
색인 작성기에서 색인 판독기를 가져옵니다.
업데이트 : 현재 방법이 open a directory reader using an index writer 개체 인 것처럼 보입니다. http://wiki.apache.org/lucene-java/NearRealtimeSearch
어떻게 실시간 인덱싱에 도움이 될까요? – Mikos
검색을 허용하여 커밋 시점 이전의 문서를 찾을 수있게합니다. 작가가 얻은 독자는 문서가 추가 될 때마다 지속적으로 업데이트됩니다. –
IndexReader를 시도하는 동안 reader = indexWriter.getReader(); IndexWriter 유형의 getReader() 메소드가 표시되지 않습니다. http://lucene.apache.org/core/4_7_2/core/org/apache/lucene/index/IndexWriter.html?is-external=true –
시도 Zoie
Zoie는 약속을했지만, 문서와 코드 샘플이 심각하게 부족하다는 것을 알았습니다. Zoie와 함께 인덱싱 할 문서가 일괄 처리되면 인덱싱이 빠르지 만 한 번에 몇 개의 문서를 인덱싱하는 것은 실제로 매우 느립니다. 개인적으로 원시 Lucene을 사용하기 쉬운 API로 사용했습니다. –
루씬 위키 몇 가지 정보가 있습니다. 그것은 여전히 매우 새롭지 만, NoSQL 정신으로 분산 Solr 색인을 제공 할 것입니다.
SolrCloud 유망 같습니다
Lucene에는 정확하게이 필요를 해결하기 위해 거의 실시간 검색이라고하는 기능이 있습니다.
IndexReader가 IndexWriter와 동일한 JVM에 있어야합니다.
IndexWriter를 사용하여 변경 한 다음 IndexReader.open (writer)을 사용하여 작성기에서 직접 읽거나 이전 Lucene 릴리스 writer.getReader()를 사용하여 판독기를 엽니 다. 이 호출은 일반적으로 판독기를 여는 데 일반적으로 소요되는 비용이 많이 드는 커밋을 우회하므로 대개 (리더를 마지막으로 연 이후로 변경 한 횟수에 비례하여) 매우 빠릅니다. 작가는 커밋되지 않은 변경 사항을 검색 할 수 있습니다.
이 판독기는 여전히 작성기에서 포인트 인 타임 스냅 샷을 검색합니다 (예 : 열어 본 모든 변경 사항).
- 1. Lucene 인덱싱
- 2. Lucene 칼럼 CLOB 인덱싱
- 3. Lucene 인덱싱 및 검색
- 4. Lucene 인덱싱 - 웹 서비스 사용
- 5. 다른 분석기로 lucene 문서 인덱싱
- 6. Lucene 성능
- 7. InnoDB를위한 인덱싱 된 MySQL 인덱싱/검색 대체?
- 8. 구조화 및 비 구조화 인덱싱 - Lucene 및 Hbase
- 9. 인덱싱
- 10. Lucene 키워드 알림
- 11. lucene에서 다국어 단어 인덱싱
- 12. Katta vs Lucene + Infinispan
- 13. 맥 인덱싱 및 CLASSPATH 문제 - java.lang.NoClassDefFoundError가
- 14. 인덱싱 등록 정보 파일
- 15. 실시간 실시간 그래프 라이브러리
- 16. lucene 색인 객체가 메모리에 있습니다.
- 17. ESE의 인덱싱
- 18. MongoDB를 인덱싱
- 19. UITableView 인덱싱
- 20. 인덱싱 서비스 :
- 21. Grails 인덱싱
- 22. 실시간 폴링없이 실시간 스트리밍 스트리밍
- 23. Lucene BooleanQuery
- 24. Lucene 버전
- 25. Lucene QueryParser
- 26. lucene/python
- 27. Lucene TermFrequenciesVector
- 28. Lucene Jackrabbit
- 29. Lucene 및 Nhibernate로 인덱싱 및 검색을 사용하여 토큰 화기를 구성하는 방법
- 30. Lucene (.NET)에서 스코어링 비활성화하기
실시간 인덱싱은 무엇입니까? 당신이 찾고있는 것을 조금 더 설명해 주시겠습니까? –
2 년 동안 solr에서이 작업을 계속 해왔다. solr은 실시간 인덱싱과 관련하여 올바른 플랫폼이 아닙니다. 큰 인덱스에서는 커밋이 매우 무겁습니다. 시간당 커밋을 1 회 처리 할 수있는 대규모 설치에 대해서는 들어 봤습니다. 즉, Lucandra라고하는 최근 프로젝트가 유망하다고 증명할 수 있습니다. 지금은 문서를 찾을 수 없지만 커밋 할 필요가 없다는 말을 들었습니다. http://github.com/tjake/Lucandra#readme –
더 자세히 설명해야합니다. "실시간"에는 특별한 의미가 없습니다. 최소 허용 가능한 지연을 지정해야합니다. 예를 들어, 비 실시간 인덱스의 경우 소프트 실시간 (예 : 업데이트를 표시하는 데 5-10 초 소요)이 어렵지 않습니다. – StaxMan