gensim

    0

    1답변

    저는 Phrases 클래스를 사용 중이며 2D 공간에서 벡터를 시각화하고 싶습니다. Word2Vec에서이 작업을 수행하기 위해 T-SNE을 사용했으며 완벽하게 작동했습니다. 내가 프레이즈 (Phrases)와 동일하게하려고 할 때 그것은 의미가 없습니다 (관련없는 단어 옆에 단어가 나타남). 문구 출력을 시각화하는 방법에 대한 제안 사항이 있으십니까?

    2

    1답변

    Im gensims 최신 버전에서는 파일에서 훈련 된 벡터를로드하는 데 KeyedVectors을 사용하고 dosent에는 새 Word2Vec 객체를 인스턴스화해야합니다. 하지만 model.vector_size 속성을 사용할 수 없기 때문에 코드가 손상되었습니다. 그 대안은 무엇입니까? 나는 단지 kv[kv.index2word[0]].size보다 나은 것을

    2

    1답변

    LDA 출력 (lda.show_topics (num_topics = -1, num_words = 100 ...))에서 주제를 처리 한 다음 pyLDAvis 그래프와 비교하지만 주제 번호에 다른 번호가 매겨져 있어야합니다. 방법 나는 그들과 일치 할 수 있습니까?

    3

    1답변

    gensim의 ldamodel에는 get_document_topics 및 get_term_topics의 두 가지 메소드가 있습니다. 이 gensim 튜토리얼 notebook에서의 사용에도 불구하고 , 나는 완전히 아래 무슨 뜻인지 보여 get_term_topics의 출력을 해석하는 방법을 이해하고 독립적 인 코드를 생성하지 않습니다 from gensim i

    3

    1답변

    Google에서 다운로드 한 모델을 가져 오려고합니다. 나는 다음과 같은 코드를 사용하여이 일을 해요 : 실행할 때 import gensim model= gensim.models.KeyedVectors.load_word2vec_format('C://gensim/model/GoogleNews-vectors-negative300.bin.gz', binary

    0

    1답변

    루프를 사용하여 행 단위로이 함수를 실행하면 작동합니다. pandas.DataFrame.apply를 사용하여 동일한 함수를 실행하면 ValueError가 반환됩니다. 피연산자를 도형과 함께 브로드 캐스트 할 수 없습니다. pandas.DataFrame.apply가 작동해야합니까? 그것이 설명하기 쉽지 않은 것들 중 하나라면, 다중 처리 이외의 처리 속도를

    3

    1답변

    gensim과 함께 python을 사용하여 영어 wikipedia에서 word2vec 모델을 학습하고 싶습니다. 나는 그것에 대해 https://groups.google.com/forum/#!topic/gensim/MJWrDw_IvXw를 밀접하게 따랐다. 그것은 저에게 효과적이지만 결과 word2vec 모델에 대해 마음에 들지 않는 것은 명명 된 요소가 분

    1

    1답변

    내 문서의 고유 식별자로 Doc2Vec 태그를 사용하고 있습니다. 각 문서는 다른 태그를 가지고 의미 론적 의미가 없습니다. 태그를 사용하여 특정 문서를 찾았으므로 이들 간의 유사성을 계산할 수 있습니다. 태그가 내 모델의 결과에 영향을 줍니까? 이 tutorial에서는 매개 변수 train_lbls=false에 대해 이야기하고 있으며이 값을 false로

    0

    1답변

    pkl 파일에서 doc2vec 모델을로드하면이 오류가 발생합니다. --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-45-5ed9dc71f3a6

    1

    1답변

    나는 word2vec 튜토리얼을 살펴보고 Text8Corpus의 주어진 예제 데이터로 학습 할 수있었습니다. Tutorial link하지만 사용자 지정 데이터를 테스트하려고 시도했지만 모델은 교육이 아닙니다. 입력은 파이썬리스트에서 유니 코드 문자열 형식입니다. 그리고 min_count도 1로 설정되어 있습니다. 위의 입력 형식에서 학습이 아니기 때문에 주