gensim

    0

    1답변

    gensim에서 word 및 doc 벡터를 학습하는 동안 log-probability를 출력하고 싶습니다. 나는 "slow plain numpy"버전에서 스코어 함수의 구현을 살펴 보았다. def score_cbow_pair(model, word, word2_indices, l1): l2a = model.syn1[word.point] # 2d ma

    0

    1답변

    를 사용하여 모델을 doc2vec 재교육하는 방법을, 나는 모델을 훈련하고 저장 한 다음 파일 : 그러나 1. model 2. model.docvecs.doctag_syn0.npy 3. model.syn0.npy 4. model.syn1.npy 5. model.syn1neg.npy , 나는 문서에 레이블을 수있는 새로운 방법을 가지고 훈련 할 다

    0

    1답변

    NLP 작업에 Gensim을 사용하고 있으며 현재 빈 문서가 포함 된 코퍼스가 있습니다. 이것이 옵션이긴하지만 내 코드를 다시 실행하고 싶지 않고 단지 내용이없는 문서를 제거하려고합니다. 문서는 이미 TF-IDF corpora로 저장되어 있으며 비어있는 이러한 문서를 제거 할 수있는 방법이 있는지 궁금해하고있었습니다. 나는 어떤 문서가 비어 있는지를 알아낼

    0

    2답변

    내가 libbz2-DEV 그러나 설치 한 gensim를 가져 오는 동안 난 아직도 다음과 같은 가져 오기 오류가 발생하고 이름없는 : >>> import gensim Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/home/krishna/gensi

    0

    2답변

    기사에서 카테고리를 추출하는 방법에 대한 아이디어가 있거나 길을 줄 수 있습니까? 내가 가지고있는 것은 내가 일할 수있는 수천 개의 기사 (스포츠, 뉴스, 사업 등에 관한 것)의 모음입니다. 스포츠에 대한 기사를 프로그래머 경우는 축구 나 농구 (또는 다른 뭔가를해야만) 때문에 출력이 뭔가를해야만처럼 될 것입니다 경우 예를 들어, 내가 알고 내 프로그램을

    0

    3답변

    Windows에 gensim을 설치할 수 없습니다. gensim을해야합니다. 즉시 설치하고 설치하기 전에 자세한 정보와 그 전에 설치해야하는 기타 소프트웨어를 알려주십시오. 덕분에는

    0

    3답변

    Gensim Doc2vec 모델을 사용하여 문서 벡터를 학습합니다. 나는 '좋은'이라는 표현에 대한 표현을 인쇄했지만 모든 신기원을 발견했다. ID가 '3'인 문서에 대한 표현을 인쇄하는 동안 모든 다른시기는 다릅니다! 내 코드는 다음과 같습니다. 무슨 일이 일어나고 있는지 잘 모릅니다. model = gensim.models.Doc2Vec(dm = 0,

    0

    2답변

    임 확신 메신저 : #!/usr/bin/env python # -*- coding: utf-8 -*- import logging from gensim import corpora, models, similarities from collections import defaultdict from pprint import pprint # pretty-pr

    0

    1답변

    위기 기간을 식별하기 위해 뉴스 스 니펫을 분석하려고합니다. 그렇게하기 위해, 나는 지난 7 년 동안 이미 뉴스 기사를 다운로드하여 제공했습니다. 이제이 데이터 세트에 LDA (Latent Dirichlet Allocation) 모델을 적용하여 경제 위기의 징후를 보이는 국가를 확인합니다. 나는 요르단 이발사에 의해 블로그 포스트 (https://rstud

    0

    1답변

    은 내가 doc2vec의 문구를 갖고 싶어하고 난 gensim.phrases를 사용합니다. doc2vec에서 모델을 교육하기 위해 태그가있는 문서가 필요하며 문구에 태그를 지정할 수 없습니다. 내가 어떻게 할 수 있니? 여기 Phrases()의 호출이 문구 창출 모델을 기차 내 코드 text = phrases.Phrases(text) for i in ra