TF-IDF (중량) = TF의 * 로그 될 | N |/d);
나는 gensim에서 언급 한 tf-idf 구현을 진행하고있었습니다. 문서에 주어진 예는 분명히 TF - IDF의 표준 구현을 따르지 않는
>>> doc_bow = [(0, 1), (1, 1)]
>>> print tfidf[doc_bow] # step 2 -- use the model to transform vectors
[(0, 0.70710678), (1, 0.70710678)]
입니다. 두 모델의 차이점은 무엇입니까?
참고 : 0.70710678은 일반적으로 고유 값 계산에 사용되는 값 2^(- 1/2)입니다. 고유 값은 TF-IDF 모델에 어떻게 들어 옵니까?
위키