나는 텍스트 클러스터링하는 동안 두싯 0.9 클러스터 덤프와 관련된 질문했다 - '클러스터 덤프의ClusterDump 0.9
이 https://mahout.apache.org/users/clustering/clusteringyourdata.html
한 경우는 출력에 최고 케이 kerms이며, 그것을 위해 당신은 돈 매개 변수 p (pointsDir)를 지정하십시오.
클러스터 덤프의 두 번째 경우는 매개 변수 p (pointsDir)를 지정하고 클러스터와 관련된 점을 얻는 경우입니다.
두 출력에는 동일한 정확한 클러스터 ID가 있지만 사례 1 - 상위 용어가 표시되는 레코드 수는 사례 2에 나타나는 레코드 수와 다릅니다 - 클러스터와 관련된 지점을 얻는 곳.
왜 이런 일이 발생합니까? 나는 특정 클러스터와 관련된 여러 포인트를보고 그 중 어느 것이 옳은지 알지 못한다는 것을 의미합니까?
이 상황을 본 사람이 있습니까?
미리 감사드립니다.
마지막으로 웹에이 문제에 대해 많이 검색 한 후, 나는이 문제를 논의 링크를 발견