2012-11-13 4 views
1

K- 평균 알고리즘을 사용하여 스파 스 매트릭스를 클러스터링하려고합니다. Apache mahout을 사용 하겠지만 Java로 구현할 수있는 방법에 대한 예제를 찾지 못했습니다. 거기에 대한 자습서 또는 함수 javadoc 있나요?Apache Mahout 소개 K- 평균 클러스터링

KmeansDriver의 run() 함수를 시도했지만 실제 매개 변수를 제공하지 않았습니다. 믿을만하게, 나는이 기능의 구현을 이해하지 못했다. 행렬, 데이터 세트 또는 파일을 사용하고 클러스터 된 데이터를 제공하는 것에 대한 명확한 예가 있습니까? http://svn.apache.org/viewvc/mahout/trunk/examples/src/main/java/org/apache/mahout/clustering/syntheticcontrol/kmeans/Job.java?view=markup

내가 당신을 도울 수 있기를 바랍니다 :

+0

[Weka] (http://www.cs.waikato.ac.nz/ml/weka/)를 사용하면 모든 데이터 마이닝 작업에 훨씬 적합한 라이브러리입니다. –

+1

Weka가 매우 큰 데이터 세트로 제대로 작동하지 않습니다. 나는 그것을 사용했지만 9 시간 만에 결과를 얻었다. – JoshuaJeanThree

+0

얼마나 많은 인스턴스와 몇 개의 클러스터가 있습니까? –

답변

0

여기 KMeansDriver를 사용하고 그 실행 방법을 좀 더 매개 변수를 설명하는 예입니다.

관련 문제