2010-08-19 9 views
1

두 노드에서 실행중인 프로그램이 전체 파일 시스템을 볼 수 있도록 완전히 다른 방식으로 서로 다른 위치에있는 두 노드간에 파일 시스템을 공유해야합니다.작은 수의 노드를위한 중복 분산 파일 시스템

상황에 따라 데이터 파일을 임의의 노드에 저장할 수 있고 다른 노드에서 실행중인 프로그램이 제 3 자에 의해 파일의 존재를 알리고 그것이 존재할 것으로 기대할 수 있습니다. rsync 미러링은 집에서 만든 트릭으로 가속화 되더라도 대기 시간이 너무 길다. 확실히 우리는 공유 파일 시스템이 필요합니다.

다른 데이터 센터에 도달 할 수 없으면 단일 노드로 계속 이동할 수 있도록 Redundandy가 필요합니다.

파일을 공유 할 노드가 2 ~ 3 개 밖에 없기 때문에 아마도 lustre 또는 HDFS가 과용되지만 Ceft가 너무 어려워서 XtreemFS에 어려움이 있고 DRBD가 좋지만 (작은) 나는 두려워 할 수 있습니다. 사이트 간 높은 네트워크 대기 시간을 뛰어 넘는 문제가있을 수 있습니다.

일부 확실성이 누락 되었습니까? 누군가 두 개의 데이터 센터에서 파일 시스템을 공유하면서이 설정을 실제로하고 있습니까?

답변

2

우수 LizardFSGfarmFS을 권장합니다.

Ceph은 너무 복잡하여 매우 신뢰할 수없고 취약합니다. 주로 블록 저장에 사용되며 Ceph 파일 시스템은 매우 느립니다. Ceph의 복잡성과 데이터 무결성에 대한 대단한 무시 때문에 Ceph는 피하는 것이 좋습니다.
XtreemFS이 느립니다 (Java 때문일 수 있음). 그것의 건축 시스템은 지저분합니다; 데이터 무결성에 문제가 있으며 non-free/unmaintained .JAR에 의존합니다.

MARS은 DRBD의 더 나은 대안이 될 수 있지만 MARS은 수정 된 커널이 필요하며 DKMS 버전은 아직 출시되지 않았습니다.

관련 문제