2016-10-27 3 views

답변

0

카이 제곱 값은 전처리 단계 일 수있는 지형지 물 선택을 수행하는 데 사용될 수 있습니다. 그런 다음, 어휘력을 대폭 줄일 수 있습니다 (예를 들어 1M 어휘에서 가장 유용한 100,000 단어를 선택). 이 단계에는 두 가지 이점이 있습니다. 1. 다음 단계에서 모델 크기를 줄입니다. 2. 예측 시간이 빠릅니다. 단점 : 분류 성능에 영향을 미치거나 미치지 않을 수 있습니다.

분류를 진행하려면 SVK 알고리즘과 같이 모델을 교육하는 데 여전히 100K 기능을 사용해야합니다. 모델을 학습 한 후에 모델을 분류에 사용할 수 있습니다.

관련 문제