2013-07-11 1 views
1

2 옵션 : 1. Hadoop 클러스터에 HBase를 설치하십시오.이 클러스터는 오프라인 컴퓨팅도 수행하므로 하나의 hadoop 클러스터 만 의미합니다. 2. 오프라인 컴퓨팅을위한 Hadoop 클러스터를 설치 한 다음 HBase 전용 HDFS를 사용하도록 다른 Hadoop 클러스터를 설치하십시오.HBase + Hadoop을 함께 설치하고 HBase 및 Hadoop을 별도로 설치하는 것에 대한 장단점은 무엇입니까?

두 가지 옵션이 있습니다. 하나는 통합 된 클러스터이고 다른 하나는 실제로 2 개의 클러스터입니다.

이 두 가지 옵션에 대한 찬성은 &입니다.

답변

1

옵션 1 : 통합 클러스터.

장점 : HBase를 읽거나 쓰는 MapReduce가 데이터 지역으로 더 효율적입니다.

단점 : HBase 영역 서버는 일부 CPU와 메모리를 보유해야하므로 머신 (Datanode 및 TaskTracker)의 성능을 저하시킵니다. 많은 MapReduce 작업이 있으면 HBase 대기 시간이 몇 초가 될 수 있습니다. HBase 응답을 시간 내에 만들려면 더 많은 작업이 필요합니다 (예 : 읽기 성능을 향상시키기 위해 memcache 사용).

옵션 2 : 2 클러스터.

발음 : HBase 지역 서버는 HDFS 데이터 노드 및 TaskTracker의 성능에 영향을 미치지 않습니다.

단점 : MapReduce가 HBase에 액세스하려면 원격으로 데이터를 읽고 쓰는 것이 필요합니다. 이 옵션에는 더 많은 기계가 필요합니다.