2014-10-06 3 views
-2

내 hadoop 클러스터를 안전하게 유지하고 정기적 인 백업을 예약하는 가장 좋은 방법은 무엇입니까? namenode의 실시간 백업을 수행 할 수 있습니까? 백업 노드는 어떻게 설정합니까?Hadoop HDFS 백업

+0

이것은 프로그래밍 질문이 아니라 서비스 관리 질문 인 것으로 보입니다. ServerFault에 대해 묻는 것이 더 나을 것입니다. (하지만 게시하기 전에 좋은 질문을하는 지침을 읽으십시오. 질문을 확대하고 규모, 빈도 및 클러스터에 대한 쓰기 빈도에 대한 아이디어를 제공해야합니다.) –

답변

2

namenode의 백업을 자동으로 주기적으로 수행하는 보조 namenode를 설정할 수 있습니다. 네임 노드 실패의 경우, 2 차 네임 노드를 사용하여 네임 노드 메타 데이터를 재생성 할 수 있습니다.

클러스터에 HA (고 가용성)를 설정하여 namenode가 다운되면 클러스터가 HA 중에 생성 된 대체 namenode로 자동 전환되도록 할 수도 있습니다. HA에 대한 자세한 내용은 여기를 참조하십시오. http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/HDFSHighAvailabilityWithNFS.html

0

@amar는 클러스터의 고 가용성을 보장하는 솔루션을 제공합니다. 또한 사용자 오류, 논리적 손상, 재해에 대비하여 Hadoop 클러스터의 데이터를 최선으로 보호하는 방법을 고려해야하며이를 수행하는 방법은 다양합니다. HDFS 스냅 샷과 distcp를 사용하는 스크립트를 작성하여 필요한 것을 성취 할 수 있습니다. 스크립트를 작성하고 유지 관리하지 않으려면 매우 포괄적 인 백업 및 DR 기능을 제공하는 Cloudera BDR 또는 Talena과 같은 솔루션을 사용할 수 있습니다. 나는 Talena를 위해 일한다는 것을 유의한다.

관련 문제