두 개의 열이있는 데이터 프레임이 있습니다. 한 열에는 텍스트가 들어 있습니다. 해당 열의 각 행에는 세 가지 다른 클래스 (스킬, 자격, 경험)의 데이터 유형이 포함되어 있으며 다른 열은 각각의 클래스 레이블입니다. dataframe의e1071 (SVM)을 사용한 텍스트 분류
스냅 샷 :
패키지 e1071에서 SVM을 적용하는 방법. 텍스트 데이터 열을 몇 가지 점수로 변환하는 방법. 저는 텍스트 컬럼을 문서 - 용어 매트릭스로 변환하는 것을 고려했습니다. 다른 방법입니까? d-t-matrix를 만드는 방법?
http://www.rtexttools.com/documentation.html - "참고 : RTextTools는 더 이상 적극적으로 유지 관리되지 않습니다." – dfrankow