2
지원 벡터 머신을 사용하여 구문을 분류하고 있습니다. SVM을 사용하기 전에 필자는 구문 - 벡터에 대해 일종의 정규화를 수행해야 함을 알고 있습니다. 한 가지 인기있는 방법은 TF-IDF입니다.SVM을 사용할 때 TF-IDF가 필요합니까?
TF-IDF 점수가 가장 높은 용어는 종종 문서의 주제를 가장 잘 나타내는 용어입니다.
그러나 SVM이 정확히 어떤 역할을합니까? 문서의 특징을 가장 잘 나타내는 용어에 가장 높은 가중치를 부여합니까?