Windows 클러스터에서 실행되는 응용 프로그램에 대해 Lucene.NET을 실행하는 데 관심이 있습니다. 검색 문제 자체는 적지 만 상태 비 저장/클러스터 문제는 여전히 처리해야합니다.Lucene.NET 클러스터링을위한 옵션?
SOLR이 내 시나리오 (및 기타)를 처리하지만 서블릿 컨테이너 (및 Java)를 요구할 때 일부 문제가 있음을 이해합니다. Lucene.NET 기반 접근 방식의 복잡성에 따라 여전히 바이알 옵션이 될 수 있습니다. 모든 노드
가 공유 스토리지에 지속
, 일반 :내 질문은 이제 여러 호스트에서 실행의 문제를 처리하기위한 내가 가진 어떤 옵션입니까? Lucene.NET은 동시성을 투명하게 처리합니까? 서버가 캐싱에 RAM을 사용할 것인가? 그렇다면 Lucene.NET은 업데이트 된 파일을 기반으로 무효화를 투명하게 처리합니까?
복제? 각 서버에는 필요한 모든 사본이 있습니다. 모든 업데이트에서 모든 서버는 새로운 복제본을 얻습니다 (또는 비교적 간단하다면 diff). 이를위한 기존 도구 또는 최대 처리 도구는 무엇입니까?
워크로드 파티셔닝/샤딩? 각 서버는 읽기 및 갱신을 위해 자체 데이터 만 처리합니다. 이것을 처리하기위한 도구, 부분 결과 합치기 등?
기타 옵션 초기 조사에서 놓친 것일 수 있습니까?
로컬 버전을 실험 할 때 Lucene 디렉토리는 몇 백 메가와 비슷했습니다. 장기적으로 아마 1 ~ 5GB를 볼 수 있습니다. 업데이트 빈도가 어려운 경우이를 상당히 유연하게 제어 할 수 있습니다. 동시 읽기/검색로드는 매우 온건 한 것으로 예상됩니다.
직접적인 대답은 아니지만 elasticsearch (http://www.elasticsearch.org/)를 살펴보고 대부분의 요구 사항을 매우 쉽게 처리합니다. – Mikos
클러스터 멤버간에 데이터를 동기화하기위한 요구 사항은 무엇입니까? 우리는 Lucene.NET의 상당히 대규모 클러스터 배포 중간에 있으며 귀하의 상황을 더 잘 이해한다면 약간의 지침을 제공 할 수 있습니다. –