2012-01-31 1 views
2

나는 weka에서 일련의 클러스터링 분석을 실행 중이고, 나는 그것을 자동화하는 것이 내가 어딘가에 가고 싶다면 갈 길이라는 것을 깨달았다. 나는 어떻게 일하고 있는지 조금 설명 할 것이다.weka에서 클러스터링하는 동안 명령 줄을 사용하여 속성 목록을 무시하는 방법은 무엇입니까?

  • 내가 R 수동으로 모든 전처리를하고 WEKA에서 가져 오기 및 arff 파일로 다시 저장하는 CSV 파일로 저장합니다.

  • 나는 WEKA의 GUI를 사용하고, 일반적으로 그냥 arff 파일 내 데이터를 열고 클러스터링 탭으로 직접 이동하고 놀러. (내 CLI을 사용한 경험은 제한적입니다.)

내가하지만 지금은 CLI의 명령, 나는 GUI를 사용하여있어 어떤 결과를 재현하려합니다. 문제는 GUI를 사용하여 클러스터링 할 때 일반적으로 속성 목록을 무시한다는 것입니다. 명령 줄에서 무시할 속성 목록을 선택하는 방법을 찾을 수 없습니다. 예를 들어

: 나는 그것이 어떻게 작동하는지에 대한 기본적인 이해를 놓치고 경우 나도 몰라 그래서 웨카와

java weka.clusterers.XMeans \ 
-I 10 -M 1000 -J 1000 \ 
-L 2 -H 9 -B 1.0 -C 0.25 \ 
-D "weka.core.MinkowskiDistance -R first-last" -S 10 \ 
-t "/home/pedrosaurio/bigtable.arff" 

내 경험이 제한됩니다.

답변

3

데이터 전처리 기능을 필터라고합니다. 클러스터 알고리즘과 함께 필터를 사용해야합니다. 아래 예를 참조하십시오.

java weka.clusterers.FilteredClusterer \ 
-F weka.filters.unsupervised.attribute.Remove -V -R 1,5 \ 
-W weka.clusterers.XMeans -I 10 -M 1000 -J 1000 -L 2 -H 9 -B 1.0 -C 0.25 \ 
-D "weka.core.MinkowskiDistance -R first-last" -S 10 \ 
-t "/home/pedrosaurio/bigtable.arff" 

여기서 우리는 속성 1-5를 제거한 다음 xmeans를 사용합니다.

+0

명령 줄을 사용하지 않고이 기능을 자동화하는 다른 방법을 권장 하시겠습니까? 그냥 호기심 ... – pedrosaurio

+0

자바 코드가 이것을 자동화 할 수 있어야합니다. GUI를 사용하여 동일한 작업을 수행 할 수도 있지만 자동화가 아닙니다. –

+0

위에서 제공 한 회선이 제대로 작동하지 않습니다. 나는 그들이 일하는대로 편집했지만 귀하의 승인이 필요합니다. – pedrosaurio

0

당신이

명령 줄에서 특성 (matlab에) 무시 거리 함수에서 그것을해야하는 속성 무시하려면

COLUMNS = '3-last'; % The indices start from 1, 'first' and 'last' are valid as well. E.g .: first-3,5,6-last 
Df = weka.core.EuclideanDistance(); % Setup distance function. 
Df.setAttributeIndices (COLUMNS); % Setup distance function. 

내가하지 Ignore attributes from GUI

GUI 의 속성을 무시

을 누군가가 속성을 무시하는 방법을 묻는 경우 모든 답변에서 전처리 섹션의 필터를 사용하여 데이터 세트를 수정하는 방법을 설명하는 이유를 이해하십시오.

관련 문제