2016-07-21 3 views
1

svm light을 사용하여 2 진 분류 모델을 학습합니다. 모델을 사용하여 몇 가지 예를 테스트했습니다. 나는 예측 파일의 출력을보고 놀랐다. -1보다 작은 값과 1보다 작은 값을 포함하고있다. 범위가 [-1,1]라고 생각했습니다. 내가 뭔가 잘못하고 있는거야?svm 예측 파일에서 1보다 큰 값

+0

왜 [-1; 1] 범위가 있습니까? 두 클래스로 분류하는 경우 {-1; 1}이 (가) 있어야합니다. 일부 변종은 새로운 데이터가 거터에있을 때] -1 [1] 이내의 확률을 제공합니다. 다른 사람들은 시궁창과의 거리를 찾으며, 따라서 시야 밖의 {-1; 1}과 다른 값을 갖습니다. 당신이 기대하는 것과 그 이유를 조금 더 설명해 주시겠습니까? –

+0

@IgorOA, 내 이해는 각각 -1과 -1의 부정과 긍정에 대한 예측이었습니다. 그러나 예측은 확실성의 척도로서 -1과 1 사이의 값일 수 있습니다 (-1/+ 1은 100 % 확실 함을 의미). 그러나 이것은 잘못된 것처럼 보입니다. – Rakib

답변

1

SVM의 작동 방식을 이해하면 값이 [-1, 1] 간격으로 묶이지 않는 이유가 있습니다. SVM은 음의 데이터 포인트와 양의 데이터 포인트를 구분하면서 선으로부터 거리를 최대화하려고 시도합니다.

예측 파일의 값은 양수 값이 초평면의 양수 클래스면에 있고 음수 값이 초평면의 음수 클래스면에있는 SVM 최적 초평면의 데이터 거리를 나타냅니다. 이 거리가 임의의 큰 또는 작은 수 있으며이 이미지에서 볼 수 있듯이 경계되지 않은 : 나는 그들이 자신감이되도록 값을 정상화 등 Platt's SMOWeka's implementation 같은 일부 SVM 구현을 본 적이

A data point could be infinitely far from the hyperplane in feature space.

값은 [0, 1]의 간격으로 묶인 양수 클래스의 값이지만, 하이퍼 플레인에서 멀리 떨어져있는 데이터 포인트가 초평면에 가까운 것보다 더 확실하기 때문에 SVM이 분류에 얼마나 자신이 있는지를 결정하는 데는 모두 잘 작동합니다 .