gensim

    0

    1답변

    주제 모델링에 gensim을 사용하고 있습니다. wordDict = corpora.Dictionary(trimmedTextTokens) gsCorpus = [wordDict.doc2bow(text) for text in trimmedTextTokens] 여기서 trimmedTextTokens는 중지 단어를 제거한 결과입니다. 이제 제한되거나 구성된

    2

    1답변

    주제 모델링으로 텍스트를 분석하고이를 Gensim 및 pyLDAvis를 사용하여 분석합니다. Python과 모든 필수 라이브러리를 설치할 필요없이 멀리 떨어진 동료와 결과를 공유하고 싶습니다. 대화 형 그래프를 HTML/JS 파일로 내보내 웹 서버에 업로드 할 수 있습니까? 나는 그것을 구현하는 방법을 문서에 언급 된 뭔가를 찾았지만 아무 생각했습니다 ht

    0

    1답변

    나는 gensim w2v 모델을 훈련 한 텍스트 데이터 세트가 있습니다. 이제는 벡터를 사용하여 데이터 세트의 단어 및 문서에 대한 tf-idf 값을 사용하고 싶습니다. 그것을하는 올바른 방법은 무엇입니까? gensim 사이트에서 tutorial을 팔로우하려고했습니다. 나는 models.tfidfmodel(model.wv[model.wv.index2word

    0

    2답변

    gcc이 설치된 Lubuntu 16.04 시스템을 실행 중입니다. 내가 doc2vec model을 훈련 할 때, 그것은 오직 한 번에 두려운 속도로 느린 훈련을 받기 때문에 gensim이 cython과 작동하지 않습니다. 내가 말한대로 gcc이 처음부터 설치되었습니다. 나는 실수를해서 gensim을 cython 앞에 설치했습니다. 나는 pip을 통해 gen

    1

    1답변

    문서에서 특성 벡터를 추출하는 데 gensim을 사용하고 있습니다. 내가 구글에서 사전 훈련 모델을 다운로드 한 GoogleNews-vectors-negative300.bin 이름 난 다음 명령을 사용하여 해당 모델을로드 : model = models.Doc2Vec.load_word2vec_format('GoogleNews-vectors-negative30

    0

    1답변

    word2vec gensim 패키지를 사용하여 내 데이터 세트에서 word2vec 모델을 교육했습니다. 내 데이터 세트에는 약 131,681 개의 고유 단어가 있지만 모델은 모양의 벡터 행렬 (47629,100)을 출력합니다. 따라서 47,629 단어 만 벡터가 연관되어 있습니다. 나머지는 어때? 모든 고유 단어에 대해 100 차원 벡터를 얻을 수없는 이유

    0

    2답변

    , 유사성 점수를 찾을 수는/하나의 단어의 가장 유사한 단어, 지금은 같은 단어 구문의 유사성 점수를 찾으려면, 그러나 model.most_similar('man') model.similarity('man', 'woman') 하여 수행 할 수 있습니다 model.most_similar('battery life') model.similarity('ba

    3

    1답변

    나는 수천 줄의 텍스트 데이터 세트를 가지고있다. 목표는 tfidf 점수를 계산 한 다음 문서 사이의 유사성을 코사인하는 것이다. 이것은 gensim을 사용하여 만든 것이다. 파이썬 튜토리얼을 따라 : dictionary = corpora.Dictionary(dat) corpus = [dictionary.doc2bow(text) for text in da

    3

    1답변

    나는 gensim의 Doc2Vec을 가지고 놀고 있는데, stackexchange 덤프를 분석하여 질문의 의미 론적 유사성을 분석하여 중복을 식별합니다. Doc2Vec-Tutorial의 자습서는 입력을 태그가 지정된 문장으로 설명합니다. 그러나 원래의 논문 : Doc2Vec-Paper은이 방법을 사용하여 단락/문서의 고정 길이 벡터를 추론 할 수 있다고 주

    2

    1답변

    현재 파이썬으로 NLP를 작업 중입니다. 그러나 내 코퍼스에는 영국과 미국 영어가 모두 있습니다 (실현/실현) 저는 영국인을 미국인으로 전환 할 생각입니다. 그러나, 나는 그것을 할 수있는 좋은 도구/패키지를 찾지 못했습니다. 어떤 제안?