문자열/범주 형 기능을 자동으로 인코딩 할 수있는 클래스가 libsvm에 있습니까? libsvmstringoutcomedatawriter라는 것을 발견했습니다. 어떤 형식의 인코딩을 사용합니까? 핫 인코딩 하나?libsvm의 범주 형 변수 인코딩
1
A
답변
0
LibSVM에 대해 기능을 인코딩하는 방법은 SVM에서 사용하는 커널에 따라 다릅니다. 예를 들어 문자열을 SVM에서 직접 기능으로 사용할 수있는 문자열 커널이 있습니다. LibSVM FAQ은 LibSVM과 함께 사용할 수있는 문자열 커널의 구현에 대해 설명합니다. 나는 또한 그것을 시험하지 않았지만 string kernel implementation in Python을 발견했다.
범주 형 기능은 LibSVM에서 사용할 수있는 표준 커널과 함께 사용할 수 있습니다. 범주 형 기능을 인코딩하는 일반적인 방법은 각 범주 형 값을 특정 기능의 값 1
으로 나타내는 이진 특성으로 변환하는 것입니다. 예를 들어 기능이 color={red, green, blue}
인 경우 red={0,1}
, green={0,1}
, blue={0,1}
의 세 가지 기능을 사용할 수 있습니다. 그런 다음 Gaussian/RBF와 같은 커널은 문제없이 데이터를 처리 할 수 있어야합니다.
+0
하지만이 인코딩을 수동으로해야합니까? 그리고 POS 태그 인 기능을 인코딩하려고합니다. 그들에 대한 자세한 내용은? –
관련 문제
- 1. 범주 형 변수/요소 코딩
- 2. weka의 여러 수준의 범주 형 변수
- 3. lm의 범주 형/이진 변수 처리
- 4. StreamingLogisticRegression with SGD에서 범주 형 변수 처리
- 5. 범주 형 변수가있는 biglm
- 6. 범주 변수 수준을 내가 제공/결합하는 수준으로 변경 두 범주 형 변수
- 7. 파이썬의 다른 범주 형 변수와 비교하여 범주 형 변수를 플롯
- 8. 범주 변수
- 9. 벡터화는/범주 형 변수와 Dataframe 대조
- 10. 범주 형 변수를 클러스터하는 방법?
- 11. Lavaan - CFA - 범주 형 변수 - 마지막 임계 값이 이상 함
- 12. 4 개의 더미로부터 요인/범주 형 변수 만들기
- 13. ANN (신경망)에 대한 R의 범주 형 변수 변환
- 14. R 쿼리 : 범주 형 변수에서 더미 변수 만들기
- 15. R에 2 개의 범주 형 변수를 결합하여 새 변수 만들기
- 16. 두 가지 범주 형 변수 간의 관계를 설명합니까?
- 17. R - 플롯 - 범주 형 변수 - 유한 'xlim'을 필요로
- 18. 두 범주 형 변수 간의 상호 작용 R
- 19. pandas pd.cut을 사용하여 statsmodels을 사용하여 범주 형 변수 생성
- 20. 상호 배타적 인 더미 변수에서 범주 형 변수 만들기
- 21. 범주 형 변수 R의 빈 교차 표 형식
- 22. ipython 노트북 및 patsy 범주 형 변수 (수식)
- 23. Matlab LIBSVM의 grid.py
- 24. ggplot에서 범주 형 x 축 확대
- 25. 범주 변수 : 치수 불일치
- 26. 범주 형 변수의 가능한 순열 수
- 27. SyndicationItem 형 컨텐츠 인코딩
- 28. randomForest 범주 형 예측 자 제한
- 29. 열의 문자열을 범주 형 변수로 변환
- 30. HTTP 매개 변수 인코딩
Cleartk libsvm에는 ibsvmstringoutcomedatawriter 클래스가 있습니다. –