0
주제 모델링에 gensim을 사용하고 있습니다.gensim을 사용하여 제한된 어휘에서 코퍼스의 단어를 필터링하는 방법은 무엇입니까?
wordDict = corpora.Dictionary(trimmedTextTokens)
gsCorpus = [wordDict.doc2bow(text) for text in trimmedTextTokens]
여기서 trimmedTextTokens는 중지 단어를 제거한 결과입니다. 이제 제한되거나 구성된 어휘 목록에없는 용어를 필터링하려고합니다. 어떤 아이디어? 고맙습니다!!
감사합니다! 감사합니다. – tom
도움이되는 답변을 찾으면 받아 들일 수 있다면 감사하겠습니다. – ginge