2012-04-30 5 views
2

RBF 커널 matlab 함수를 사용하고 있습니다. σ 값이 증가함에 따라 지원 벡터 수가 증가하고 정확도가 증가함에 따라 몇 가지 데이터 세트가 증가했습니다. 하나의 데이터 세트의 경우, 시그마 값을 증가 시키면 지원 벡터가 감소하고 정확도가 증가합니다. RBF 커널의 경우 지원 벡터와 정확도 사이의 관계를 분석 할 수 없습니다.RBF 커널의 경우 지원 벡터와 정확도 사이의 관계

+0

코드, 실제 출력 및 예상 결과를 알려주십시오. – vyegorov

답변

3

지원 벡터의 수는 정확도와 직접적인 관련이 없습니다. 데이터의 모양 (및 C/nu 매개 변수)에 따라 다릅니다.

높은 시그마는 커널이 "더 평평한"가우시안이므로 의사 결정 경계가 "더 매끄 럽습니다. 시그마가 낮 으면 "날카로운"최고점이되므로 의사 결정 경계가보다 유연하고 이상적인 모양을 올바르게 재현 할 수 있습니다. 시그마가 매우 높으면 데이터 포인트가 매우 큰 영향을 미칩니다. 매우 낮 으면 매우 작은 영향력을 갖습니다.

따라서 시그마 값을 늘리면 더 많은 지원 벡터가 생깁니다. 동일한 결정 경계보다 많거나 적은 경우, 점이 "흐릿하게"표시되기 때문에 더 많은 점이 마진 안에 들어갑니다. 증가 된 시그마는 여백을 넘어선 "움직이는"여유 변수가 더 비싸기 때문에 분류 자의 마진이 훨씬 적고 SV가 적을 수 있음을 의미합니다. 물론, 완전히 다른 수의 SV로 극적으로 다른 결정 경계를 줄 수도 있습니다.

정확도를 극대화하려면 C와 시그마의 다양한 값에 대한 그리드 검색을 수행하고 예를 들어 다음과 같이 최상의 성능을 제공하는 것을 선택해야합니다. 교육 세트에서 3 배 교차 검증. 하나의 합리적인 접근법은 예를 들어에서 선택하는 것입니다. C에 대해 2.^(-9:3:18)median_eval * 2.^(-4:2:10); 그 수는 상당히 자의적이지만, 과거에 성공으로 사용했던 수입니다.