필자는 대부분의 텍스트 분류 작업을 위해 선형 커널을 선택하는 많은 저자가 있다고 가정하고 지원 벡터 머신 서적과 기술 논문을 많이 읽었습니다.본질적으로 고차원 공간에 존재하는 텍스트 분류 데이터에 관한 질의
그들은 텍스트 분류 문제의 데이터가 이미 고차원 공간에 있기 때문에 SVM을 사용하여 데이터를 분류하는 동안 선형 커널을 선택하여 데이터를 분리하는 것으로 충분합니다.
다음과 같이 가정의 나의 이해는 다음과 같습니다 텍스트 분류 작업에서는
, 분류에 대한 선택됩니다 (우리가 문서를 찾고 있습니다 많은 경우 특정 중요한 단어에서) 기능의 수를 작업은 대부분 매우 높을 것이며 이것이 고차원 공간에있는 데이터의 의미입니다.
가정에 대한 정확한 이해가 정확합니까? 그렇지 않다면 나는 누군가가이 가정에 대해 어떤 빛을 비추려고 노력하고 싶습니다.
도움을 주시면 감사하겠습니다.
응답 해 주셔서 감사합니다. 또한 일부 샘플 데이터를 제공하는 사이트처럼 SVM을 사용하여 연습을 할 수있는 온라인 리소스가 있는지 알고 싶습니다. 또한 데이터를 분류하여 특성 벡터를 생성하고 재생할 수 있습니까? – anonuser0428
이 (가) 게시물을 편집하여 참조를 추가했습니다. – SlimJim