파일 XYZ의 데이터 크기가 68MB라고 가정합니다. 따라서 기본 블록이 64MB 인 블록은 A - 64MB 및 B - 4MB가됩니다. B 블록에서 나머지 공간은 다른 데이터 블록으로 채워집니다.HADOOP의 마지막 데이터 블록 처리
따라서 XYZ 데이터 파일에 대한 처리가 수행되면 A 블록 B 블록 데이터가 처리됩니다. B 블록 에는 다른 파일에 대한 데이터도 들어 있으므로 B 블록의 인 경우 HADOOP는 처리 할 블록의 부분을 어떻게 알 수 있습니까?
블록 B의 경우 두 개의 청크로 다시 분할됩니다. 하나는 크기가 4MB이고 나머지 데이터는 남아 있습니다. 권리!!! – user4221591
아니요, HDFS 블록은 물리적 인 Linux 파일 시스템을 둘러싼 논리적 추상화이므로 두 번째 블록은 HDFS에 4MB 논리 파일로 저장되고 해당 블록의 NameNode에는 1 메타 데이터 항목으로 저장됩니다. 그러나 후드 블록은 기술적으로 1000 개의 linux 블록 = 4MB ('4KB' ext4 블록 크기 가정)로 저장됩니다. 자세한 내용은이 [질문] (http://stackoverflow.com/questions/15062457/hdfs-block-size-vs-actual-file-size)을보십시오. – Ashrith