2016-07-27 2 views
1

문자열/범주 형 기능을 자동으로 인코딩 할 수있는 클래스가 libsvm에 있습니까? libsvmstringoutcomedatawriter라는 것을 발견했습니다. 어떤 형식의 인코딩을 사용합니까? 핫 인코딩 하나?libsvm의 범주 형 변수 인코딩

+0

Cleartk libsvm에는 ibsvmstringoutcomedatawriter 클래스가 있습니다. –

답변

0

LibSVM에 대해 기능을 인코딩하는 방법은 SVM에서 사용하는 커널에 따라 다릅니다. 예를 들어 문자열을 SVM에서 직접 기능으로 사용할 수있는 문자열 커널이 있습니다. LibSVM FAQ은 LibSVM과 함께 사용할 수있는 문자열 커널의 구현에 대해 설명합니다. 나는 또한 그것을 시험하지 않았지만 string kernel implementation in Python을 발견했다.

범주 형 기능은 LibSVM에서 사용할 수있는 표준 커널과 함께 사용할 수 있습니다. 범주 형 기능을 인코딩하는 일반적인 방법은 각 범주 형 값을 특정 기능의 값 1으로 나타내는 이진 특성으로 변환하는 것입니다. 예를 들어 기능이 color={red, green, blue} 인 경우 red={0,1}, green={0,1}, blue={0,1}의 세 가지 기능을 사용할 수 있습니다. 그런 다음 Gaussian/RBF와 같은 커널은 문제없이 데이터를 처리 할 수 ​​있어야합니다.

+0

하지만이 인코딩을 수동으로해야합니까? 그리고 POS 태그 인 기능을 인코딩하려고합니다. 그들에 대한 자세한 내용은? –

관련 문제