2011-08-09 7 views
2

매우 많은 수의 변경 가능한 문서를 관리하기위한 분산 파일 (또는 다른 저장소) 시스템을 찾고 있습니다. 각 문서는 상당히 클 수 있습니다 (1-100MB). 일부 읽기는 최신 데이터에서 작동하도록 보장해야하며 일부는 궁극적으로 일관성있는 복제 된 데이터에서 읽을 수 있어야합니다. 각 문서는 자체 포함 된 파일 일 수 있습니다 (예 : SQLite 데이터베이스 또는 다른 사용자 정의 파일 형식).결정 성있는 다중 마스터가있는 분산 형 FS?

최적의 성능을 위해 각 문서에 대한 쓰기가 발생하는 분산 파일 시스템의 노드가 달라야합니다. 즉, 서버 A는 문서 1의 마스터이고 서버 B는이를 복제하지만 서버 B는 문서 2의 마스터이고 서버 A는이를 복제합니다. 내 응용 프로그램의 경우 단일 서버가 전체 시스템에 대한 쓰기 트래픽을 모두 처리 할 수 ​​없으므로 모든 데이터에 대해 단일 마스터를 사용할 수 없습니다.

각 문서는 몇 개의 서버 (예 : 3)에 걸쳐 복제되어야합니다. 따라서 1000 개의 문서와 10 개의 서버가있는 경우 각 서버에는 300 개의 문서 사본이 있으며 그 중 100 개의 문서에 대한 마스터가됩니다. 이상적으로 클러스터는 마스터 서버가 손상된 문서의 마스터가되도록 서버를 자동으로 승격시키고 새 서버가 클러스터에 추가 될 때 스토리지로드 균형을 재조정합니다.

나는 이것이 꽤 큰 주문이라는 것을 알고 있습니다. 내 핵심 요구 사항 대부분을 충족시키는 것을 사용할 수 있습니까?

답변

0

나는 HDFS이 위에 나열된 기준에 부합한다고 생각합니다.

관련 문제