word2vec 모델에는 vocab 공간에서 단어를 숨겨진 레이어 ("in"벡터)로 가져간 다음 vocab 공간으로 되돌아가는 두 개의 선형 변환이 있습니다 ("out "벡터). 보통이 아웃 벡터는 훈련 후에 폐기됩니다. gensim python에서 벡터를 액세스하는 쉬운 방법이 있는지 궁금합니다. 동등하게, 어떻게 행렬에 액세스 할 수 있습니까?gensim word2vec 입/출력 벡터에 액세스
동기 부여 :이 최근의 논문에서 제시 한 아이디어를 구현하고 싶습니다 : A Dual Embedding Space Model for Document Ranking 다음
은 자세한 내용입니다. 상기 기준에서, 우리는 다음 word2vec 모델이 이상 :
입력 층 크기 $의 V $으로, 어휘 사이즈이다 숨겨진 레이어 출력 층 크기 $ d 개에 $이며 $ V $ 크기. 두 행렬은 W_ {IN}과 W_ {OUT}입니다. 보통, word2vec 모델은 W_IN 행렬 만 유지합니다. 이 gensim에 word2vec 모델을 훈련 후, 당신이 얻을 경우, 반환되는 것입니다 물건 같은 :
모델 [ '감자'] = [- 0.2,0.5,2, ...]
W_ {OUT}에 액세스하거나 W_ {OUT}을 (를) 유지하려면 어떻게해야합니까? 이것은 계산 상으로 많은 비용이 소요될 수 있으며, 이것을 수행하기 위해 gensim에 내장 된 메소드를 실제로 원합니다. 처음부터 코드를 작성하면 성능이 좋지 않을까 두려워하기 때문입니다.
지금까지 코드가 있습니까? – rebeling