2012-11-27 2 views
0

KNN 분류기와 함께 관리 용어 가중 모델을 사용할 수 있습니까? 테스트 문서의 라벨이 지정되지 않고 감독 용어 가중 모델에서 라벨 문서가 가중치를 계산해야하는 경우 테스트 문서 벡터를 나타내는 방법이 궁금합니다. 어느 누구도 제발 도와 줄 수 있습니까?KNN 알고리즘과 함께 관리 용어 가중치 방법 사용

+0

당신이 문서를 사용하면 임시 레이블을 할당하지 수 있습니까? CrossValidated SE에이 질문을 게시 해 볼 수도 있습니다. –

답변

0

예. 클래스 정보를 기반으로 메트릭을 사용할 수 있습니다.

  1. 기차 세트 (즉, idf)를 기반으로 각 용어에 대한 수집 기준 값을 계산합니다. 여기에는 각 용어에 대한 max.chi^2 값과 같은 클래스 기반 정보가 포함될 수 있습니다.
  2. 테스트 문서의 경우 다음과 같은 측정 값을 결합합니다. 예를 들어 열차를 기반으로 한 IDF와 TF를 곱한 max.chi^2 (열차 기준).

감사합니다,

관련 문제