2013-06-26 7 views
0

WEKA를 알아 내고 내가 가지고있는 데이터로 몇 가지 실험을 수행하려고합니다.WEKA 머신 학습 방법 베이 즈 신경 회로망 및 J48 의사 결정 트리

기본적으로 내가하고 싶은 것은 데이터 세트 1을 취하여 훈련 세트로 사용하는 것입니다. J48 결정 트리를 실행하십시오. 그런 다음 데이터 세트 2를 가져 와서 훈련 된 트리를 실행합니다. 원본 데이터 세트의 출력에는 예측 결과에 대한 추가 열이 있습니다.

그런 다음 Bayes 신경망으로 같은 작업을 다시하십시오.

누군가 내가이 작업을 얼마나 정확하게 수행 할 수 있는지에 대한 세부 지침 링크를 가르쳐 줄 수 있습니까? 일부 단계가 누락 된 것으로 보이고 추가 열이있는 원래 데이터 집합의 출력을 가져올 수 없습니다.

+0

답변을 받으려면 어떻습니까? – stackoverflowuser2010

답변

1

여기에는 명령 줄을 사용하는 한 가지 방법이 있습니다. 이 정보는 소프트웨어와 함께 제공되는 Weka 설명서의 1 장 ("명령 줄 뇌관")에 나와 있습니다.

java weka.classifiers.trees.J48 -t training_data.arff -T test_data.arff -p 1-N 

여기서

예를 들어
-t <training_data.arff> specifies the training data in ARFF format 
-T <test_data.arff> specifies the test data in ARFF format 
-p 1-N specifies that you want to output the feature vector and the prediction, 
    where N is the number of features in your feature vector. 

, 여기에 내가 훈련과 테스트를 모두 soybean.arff을 사용하고 있습니다. 특징 벡터 35 개 기능이 있습니다 :

자바 weka.classifiers.trees.J48 -t soybean.arff -T soybean.arff -p

같은 출력 모양의 처음 몇 줄 1-35 :

=== Predictions on test data === 

inst#  actual predicted error prediction (date,plant-stand,precip,temp,hail,crop-hist,area-damaged,severity,seed-tmt,germination,plant-growth,leaves,leafspots-halo,leafspots-marg,leafspot-size,leaf-shread,leaf-malf,leaf-mild,stem,lodging,stem-cankers,canker-lesion,fruiting-bodies,external-decay,mycelium,int-discolor,sclerotia,fruit-pods,fruit-spots,seed,mold-growth,seed-discolor,seed-size,shriveling,roots) 
    1 1:diaporth 1:diaporth  0.952 (october,normal,gt-norm,norm,yes,same-lst-yr,low-areas,pot-severe,none,90-100,abnorm,abnorm,absent,dna,dna,absent,absent,absent,abnorm,no,above-sec-nde,brown,present,firm-and-dry,absent,none,absent,norm,dna,norm,absent,absent,norm,absent,norm) 
    2 1:diaporth 1:diaporth  0.952 (august,normal,gt-norm,norm,yes,same-lst-two-yrs,scattered,severe,fungicide,80-89,abnorm,abnorm,absent,dna,dna,absent,absent,absent,abnorm,yes,above-sec-nde,brown,present,firm-and-dry,absent,none,absent,norm,dna,norm,absent,absent,norm,absent,norm) 

열은 다음과 같습니다. (1) 데이터 인스턴스 번호. (2) 지상 진실 상표; (3) 예측 라벨; (4) 오류; (5) 예측 신뢰도; 및 (6) 특징 벡터.