각 데이터 노드가 스토리지에 대해 다른 디렉토리를 사용하도록 Hadoop을 구성하는 방법은 무엇입니까?각 데이터 노드가 다른 디렉토리를 사용하도록 Hadoop을 구성하는 방법은 무엇입니까?
모든 데이터 노드는 저장 공간을 공유합니다. 나는 dir2를 사용하기 위해 datanode1에 dir1을, datanode2를 사용하고 싶습니다. 처음에는 공유 스토리지에서 동일한 디렉토리를 사용하도록 모든 데이터 노드를 구성했으며 실행중인 데이터 노드가 하나 뿐인 것으로 나타났습니다.
은 일회성 테스트 설정의 일종인가 네임 노드에서 쉬 파일은 각 데이터 노드에 대해 서로 다른 디렉토리 구조의 구현을 달성하기 위해? 하둡 성능은 CPU에 근접한 데이터에 크게 의존합니다. – Olaf
클러스터가 NFS와 같은 분산 파일 시스템을 실행하고 각 데이터 노드가 분산 파일 시스템의 다른 디렉토리에 로컬 데이터를 저장하도록 하시겠습니까? –
@MattD 클러스터에는 모든 DataNode가 공유하는 저장소가 있습니다. 그래서 실제로 datanode2는 dir1에 액세스 할 수 있습니다. 하지만 dfs.data.dir을 "/ dir1,/dir2"로 설정하면 모든 컴퓨터가 엉망이됩니다. – HZhang