1
저는 프로젝트에서 일하고 있습니다. 여기서 우리는 blogg 데이터 검색 프레임 워크를 소개하려고합니다. 우리는 300 GB가 넘는 대용량 데이터 세트에 대해 lucene/Solr의 성능을 예측하는 데 어려움을 겪고 있습니다.lucene/Solr 성능 및 하드웨어 요구 사항
단일 서버 설정을 사용하여 성능 요구 사항을 충족시킬 수 있는지 또는 복제 된 또는 분산 된 솔루션을 사용해야하는지 여부는 확실하지 않습니다.
누구 하드웨어 위에 추정을 제공 할 수 있고 루씬을 사용하여 실행 가능한 해결책을 확정
더 나은 측정 항목은 실제 색인 생성 가능 텍스트 콘텐츠의 크기를 찾는 것입니다. 300GB의 일반 텍스트에 대한 요구 사항은 300GB의 .doc 파일과 크게 다를 것입니다. 또한 작은 데이터 세트 (예 : 데이터의 10 %)에 대한 테스트를 실행하여 성능 및 리소스 요구 사항에 대한 아이디어를 얻으시기 바랍니다. –