저는 libSVM (선형 커널 포함)을 사용하여 데이터를 학습하고 교차 검증 (10 배)했습니다.libsvm에서 100 %의 정확도
데이터는 단일 데이터 포인트로 표시되는 1800 fMRI 휘도 보셀로 구성됩니다. svm-train의 training-set-file에는 약 88 개의 데이터 포인트가 있습니다.
+1 1:0.9 2:-0.2 ... 1800:0.1
-1 1:0.6 2:0.9 ... 1800:-0.98
...
가 나는 또한 내가 SVM-기차 스크립트를 사용하고 언급 (함께 온해야합니다
교육-설정 파일은 다음과 같습니다 libSVM 패키지).
문제는 svm-train을 실행할 때 100 % 정확도로 나타납니다.
실제 분류 결과가 반영되지 않은 것 같습니다. 그것은 100에서 감소 그리고 -
#datapoints labeled +1 == #datpoints labeled -1
Iv'e는 스케일러 (제대로 확장)를 확인하고, 또한 어떻게 영향 정확성을보기 위해 무작위로 레이블을 변경하려하기 때문에 데이터는 불균형 아니다 % ~ 97.9 %.
문제를 이해 하시겠습니까? 그렇다면 문제를 해결하려면 어떻게해야합니까?
문제가 있다고 생각하지 않습니다. SVM은 교육 세트에 100 % 적합하게 쉽게 줄 수 있지만 완벽합니다. 이것은 overfitting이라고합니다 http://en.wikipedia.org/wiki/Overfitting 필자는 샘플 내 및 샘플 밖에서의 교육에 대해 읽어야한다고 생각합니다. – sashkello
이 질문은 기계 학습에 관한 것이기 때문에 논점이 아닌 것처럼 보입니다. – sashkello
샘플 내 및 샘플 아웃 교육을 어떻게 읽을 수 있습니까? –