텍스트 분류 문제 (정서 분석)를 다루고 있습니다. scikit에 어떤 옵션이 있는지 알고 싶습니다. 기능에 "중요도"로 "가중치"를 추가하는 방법을 배우십시오. coef_ array, shape = [n_class-1, n_features]
Weights asigned to the features (coefficients in the primal
나는 스탠포드 POS 태거를 사용하여 POS 태그 문장을 얻습니다. 예 : /DT 아일랜드/NN은/VBD 매우/RB 아름다운/JJ. /. I/PRP 사랑/VBP it/PRP ./. (도 가능한 XML 형식) 사람이 POS 태그 문장에서 기능 선택을 수행하고 기계 학습 방법을 사용하여 텍스트 분류를위한 특징 벡터로 변환하는 방법을 설명 할 수 있습니다.
필자는 기능 선택을 사용하여 문서에서 이진 분류 작업에 가장 유용한 용어를 찾고 싶습니다. 나는 주위를 찾고 있었어요 : 이 상호 정보 및 카이 제곱 테스트 메트릭 언급 http://nlp.stanford.edu/IR-book/html/htmledition/feature-selection-1.html MATLAB뿐만 아니라 기능을 가지고 있습니다 :의 ht
모델을 단일 비율 (종속) 변수에 맞추기 위해 선택하려고하는 9 개의 연속 독립 변수가있는 데이터 세트가 있습니다. 점수. 불행히도, 여러 변수 사이에 심각한 공선 성이 있다는 것을 알고 있습니다. 내가 변수 선택을위한 R의 stepAIC 기능을 사용하여 시도했지만, 그 방법은, 이상한, 변수가 방정식에 나열되는 순서에 민감한 것 같다 ... 가 여기 내