1

저는 libSVM (선형 커널 포함)을 사용하여 데이터를 학습하고 교차 검증 (10 배)했습니다.libsvm에서 100 %의 정확도

데이터는 단일 데이터 포인트로 표시되는 1800 fMRI 휘도 보셀로 구성됩니다. svm-train의 training-set-file에는 약 88 개의 데이터 포인트가 있습니다.

+1 1:0.9 2:-0.2 ... 1800:0.1

-1 1:0.6 2:0.9 ... 1800:-0.98

...

가 나는 또한 내가 SVM-기차 스크립트를 사용하고 언급 (함께 온해야합니다

교육-설정 파일은 다음과 같습니다 libSVM 패키지).

문제는 svm-train을 실행할 때 100 % 정확도로 나타납니다.

실제 분류 결과가 반영되지 않은 것 같습니다. 그것은 100에서 감소 그리고 -

#datapoints labeled +1 == #datpoints labeled -1

Iv'e는 스케일러 (제대로 확장)를 확인하고, 또한 어떻게 영향 정확성을보기 위해 무작위로 레이블을 변경하려하기 때문에 데이터는 불균형 아니다 % ~ 97.9 %.

문제를 이해 하시겠습니까? 그렇다면 문제를 해결하려면 어떻게해야합니까?

+0

문제가 있다고 생각하지 않습니다. SVM은 교육 세트에 100 % 적합하게 쉽게 줄 수 있지만 완벽합니다. 이것은 overfitting이라고합니다 http://en.wikipedia.org/wiki/Overfitting 필자는 샘플 내 및 샘플 밖에서의 교육에 대해 읽어야한다고 생각합니다. – sashkello

+0

이 질문은 기계 학습에 관한 것이기 때문에 논점이 아닌 것처럼 보입니다. – sashkello

+0

샘플 내 및 샘플 아웃 교육을 어떻게 읽을 수 있습니까? –

답변

2

이 있는지 확인

감사합니다,

갈 스타 당신은 svmtrain 옵션 '-v 10' 있습니다. 100 % 정확도가 교육 샘플 또는 유효성 검사 샘플로 인한 것인지 확신하지 못합니다. 피쳐 번호보다 샘플 수가 훨씬 적기 때문에 100 % 교육 정확도를 얻는 것은 매우 가능합니다. 그러나 모델이 초과 적용으로 인해 어려움을 겪는다면 검증 정확도가 낮을 ​​수 있습니다.

+0

답변 해 주셔서 감사합니다 :) -v 10 옵션을 사용했습니다. 오버 피팅이 문제 일 수 있습니다. 그것은 높은 결과를 초래해야합니까? –

+0

가능합니다. 관심 영역을 축소하여 보셀 수 (기능)를 줄이고 교차 유효성 검사 결과를 다시 관찰하는 것이 좋습니다. – lennon310