2012-11-20 3 views
0

SVM 분류에 잘못된 범주가 있습니다. 예를 들어 과일 분류를 고려할 때 APPLE, ORANGE, BANANA 및 NOT FRUIT (무효)를 원합니다. 각각의 카테고리 (ORANGE 등 APPLE 하나)에 대해 바이너리 SVM 분류자를 생성하는 것이 더 좋은지 또는 클래스 중 하나로 잘못된 카테고리로 SVM 분류자를 생성하고 잘못된 교육 데이터로 피드하는 것이 더 좋은지 궁금합니다.SVM 및 유효하지 않은 범주

좀 더 구체적으로 말해서 시계열 데이터를 분류하는 분류 기준이 있습니다. 나는 잘못된 범주 (또는 기본적으로 원하는 범주에 속하지 않음)로 급수 시계열을 분류해야합니다.

답변

1

no_fruit은 또 다른 클래스입니다. 필요한 것은 Multiclass classification입니다. SVM은 초평면을 통해 클래스를 분리하기 때문에 위에 다른 알고리즘이 필요합니다. 대부분의 패키지는 이제 이러한 다중 클래스 분류를 제공하지만 성능에는 차이가 있습니다.

  1. 그들은
  2. 그들은 당신이 당신이 복수의 결과 (가위 바위 보)

      이 먼저 무엇 이건 각

    에 대한 각을 다른 사람의 그룹에 대해 각 클래스을

  3. 이 경우에 0에서 n까지의 포지티브가있을 수 있습니다.
  4. 이 경우 1에서 n-1 표가있는 1에서 n 개의 클래스가있을 수 있습니다.

투표를하는 라이브러리를 사용하는 것이 좋습니다.

[] '시계열 데이터'의 이야기에도 불구하고. 과일처럼 들리지 않으며 다른 요구 사항이있을 수도 있습니다.

1

SVM 패키지에 따라 다릅니다. libsvm을 사용하는 경우 여러 "긍정적 인"클래스를 가질 수 있습니다. "잘못된"클래스 0, 사과 1, 오렌지 2, 등등을 호출하십시오.

+0

여러 개의 분류자를 만들면 더 잘 훈련됩니까? Apple (예, 아니오), 오렌지 (예, 아니오) 등을위한 분류 자 ​​ – Ali

+1

다릅니다. SVM은 초평면을 사용하여 nD (또는 (n + 1) D 공간)의 데이터를 분리하려고합니다. 두 가지 카테고리가있는 경우 분리는 간단합니다. 공간의 한 점은 한쪽면 또는 다른면에 속합니다. 카테고리가 여러 개인 경우 긍정적 인 카테고리도 초평면으로 구분됩니다. 즉 모델이 사과라고 예측할 때 '유효하지 않음'을 의미 할뿐만 아니라 '오렌지색'도 아닙니다. 잘못된 과일 대 과일을 결정하는 것이 무엇인지 알고 싶거나 "사과"가 사과이고 "오렌지"가 주황색인지 유효하지 않은지 확인하는 것이 중요합니다. – Bee