2012-04-26 3 views
0

cloudera를 사용하여 하나의 시스템 (물론 많은 VM이있는)에서 Hadoop 작업을 시뮬레이트하고 싶습니다. 2 질문이 있습니다 1) cloudera에서 HDFS의 복제 정책을 변경할 수 있습니까? 2) 각 VM의 CPU 사용량을 볼 수 있습니까?Cloudera를 사용하여 맵 축소 시뮬레이션

답변

0

"ReplicationTargetChooser.java"를 변경하여 데이터 복제 정책을 변경할 수 있다는 것을 알았습니다.

1

hadoop fs -setrep을 사용하여 모든 파일의 복제 요소를 변경할 수 있습니다. 또한 다음을 추가하여 hdfs-site.xml을 수정하여 기본 복제 요소를 변경할 수 있습니다 <property> <name>dfs.replication</name> <value>2</value> </property>

당신은 각 상자에 로그인하여 각 VM의 CPU 사용량을 볼 수 top을 사용해야합니다. Hadoop에는이 기능을 볼 수있는 상자가 없습니다.

+0

감사합니다. 그러나 데이터 배치 정책을 변경하려는 요소를 변경하고 싶지는 않습니다. 각 복제본은 어느 노드에 상주한다고 말하고 싶습니다. 이 https://issues.apache.org/jira/browse/HDFS-385처럼. – Sara

+0

이전에 요청한 적이 있습니다. 불가능합니다. 아마도 당신은 당신이 실제로하려고하는 것에 대해 물어봐야 할 것입니다. 그래서 우리는 올바른 방법을 제안 할 수 있습니다. –

+0

그러나 위의 링크에서 해결 된 것 같습니다! 데이터 복제 위치를 변경하여 에너지 사용량이 어떻게 변하는 지 확인하고 싶습니다. – Sara

관련 문제