저는 scala 0.9.0에서 k-means 클러스터링을 실행 중이며 n 개의 시스템간에 데이터가 분산되어 k 개의 센터 데이터 포인트를 계산하는 방법을 이해하려고합니다.분산 계산에 대한 K- 평균 계산
k- 평균 클러스터링이란 무엇인지 알고 있지만 데이터가 어떻게 나누어지고 분산 계산 (계산 및 축소)에서 계산되는지 알고 싶습니다. 이 스칼라 버전에서 KMeansDataGenerator는 데이터 포인트를 n 개의 파티션으로 생성하는 옵션을 가지고 있습니다. 각 슬레이브 노드가 데이터 파일의 파티션 하나를 가져 옵니까?
"각 슬레이브 노드가 데이터 파일의 파티션 하나를 가져 옵니까?" 각 노드는 많은 파티션을 가질 수 있습니다. ** 각 ** 작업 **은 하나의 파티션을 가져옵니다. – samthebest