시퀀스 파일 세트에 대해 K 평균 클러스터링 알고리즘을 실행했습니다. 그러나, 생성 된 결과는 다음과 같다 : []Mahout K-means 클러스터링은 0과 같은 결과를 클러스터 1.0에 제공합니다 : []
[]0 1.0 클러스터에 속하는 []
0 1.0 클러스터에 속하는 :
0 1.0 클러스터에 속하는
0 1.0 클러스터에 속하는 []
0 1.0 클러스터에 속하는 []
0 cluste 속하는 r 1.0 : []
내가 사용하는 프로그램은 Mahout-in-Action의 9 장에 나와있는 NewsKMeansClustering.java에서 빌린 것입니다.
왜 이런 유형의 결과가 나에게 알려 주시겠습니까? 그것은 특정 매개 변수 설정 요구 사항 또는 다른 이유로 인해 발생합니까?
이 프로그램의 핵심 클러스터링 코드는 내가 두싯 0.5 사용하여 동일한 문제로 실행
CanopyDriver.run(vectorsFolder, canopyCentroids, new EuclideanDistanceMeasure(), 250, 120, false, false);
KMeansDriver.run(conf, vectorsFolder, new Path(canopyCentroids, "clusters-0"),
clusterOutput, new TanimotoDistanceMeasure(), 0.01, 20, true, false);