2016-06-03 2 views
-2

나는 다양한 단어 길이의 약 100000 개의 문서를 가지고있다. 나는 또한 전체 자료에 word2vec 모델을 훈련시켰다. 이제이 단어 벡터를 사용하지 않고 각 개별 문서에 대해 동일한 차원의 지형지 물을 생성하려면 어떻게해야합니까?단어 벡터로 문서 피쳐를 만드는 방법은 무엇입니까?

나는이 작업을 수행하는 방법에 대해 알고 있는데, 하나는 문서의 모든 단어에 대한 벡터의 평균을 취하고 다른 하나는 k-means 클러스터링을 수행하는 것입니다.

이 작업을 수행하는 다른 방법을 제안 할 수 있습니까?

답변

관련 문제