2012-06-11 2 views
0

n 차원을 고려한 지원 벡터 머신을 설계하고 있습니다. 모든 차원에서 값의 범위는 [0-1] 일 수 있습니다. 이제 여러 가지 이유로 특정 데이터 요소에서 원래 데이터 세트의 특정 차원에 대한 값을 결정할 수없는 경우 SVM에 대한 해당 차원의 값은 무엇입니까? 누락 된 값을 나타내는 [-1]로 지정할 수 있습니까?지원 벡터 머신의 차원에서 NULL 값

감사 Abhishek S

+1

아니요, 특별히 누락 된 값을 처리해야합니다. 그렇지 않으면 svm은 나쁜 것들을 배우게됩니다. 누락 된 데이터를 처리하는 몇 가지 방법이 있습니다. – Ran

+0

브릴리언트. 감사. 평균화 등에 관한 몇 가지 방법을 보았습니다. –

답변

0

당신은 더 나은 차원이 공간의 컴퓨터의 파티션에 공헌 할 수 없습니다 경우 모두 누락 된 값을 떠날 제공 될 것입니다. SVM이 수행 할 수있는 유일한 작업은 해당 차원의 모든 점이 같은 위치에 있으므로 분류 능력만큼 해당 차원에 제로 가중치를 배치하기 때문입니다.

따라서이 차원을 넘어가는 각 계산 자원은 낭비됩니다. 이 값을 복구하는 것이 중요한 경우 일부 유형의 회귀 모델을 사용하여 예상 값을 다시 가져올 수는 있지만 추정 된 값이 다른 데이터에서 생성 된 경우 실제로 다시 실제 데이터에 기여하지는 않습니다 SVM은 그 추정 된 차원의 데이터가 더 이상 당신이 그것을 생성하는데 사용한 데이터의 요약이 아니기 때문에 (SVM 모델에 이미 있다고 생각할 것입니다).