왜 문장의 스플리터/토크 나이저가 작동하지 않습니까? nltk는 잘 작동하는 것 같습니다. 여기 내 작은 경험이 있습니다. import spacy
nlp = spacy.load('fr')
import nltk
text_fr = u"Je suis parti a la boulangerie. J'ai achete trois croissants. C'eta
nltk.org 책 7 장에서 작업을 시도했습니다. 특히 섹션 3.2 아래 http://www.nltk.org/book/ch07.html에 ConsecutiveNPChunker 클래스가 있습니다. 코드를 복제하려고했습니다. 그러나, 그것은 일관되게 다음을 던졌다 : ValueError. 나는이 프로그램을 실행했을 때 import nltk
from nltk
나는 유사성을 분석 할 필요가있는 수백 개의 txt 파일이있는 폴더가 있습니다. 다음은 유사성 분석을 실행하는 데 사용하는 스크립트의 예입니다. 결국 배열이나 행렬 등을 얻을 수 있습니다. cos_similarity > 0.5 (또는 다른 임계 값을 사용하기로 결정했습니다.) 동일한 파일을 비교할 때 cos_similarity == 1을 제거하면 얼마나 많
ngrams를 사용하여 남성과 여성의 이름을 분류하는 작업을하십시오. 내가 만든 (N = 2,3,4) name is_male
Dorian 1
Jerzy 1
Deane 1
Doti 0
Betteann 0
Donella 0
특정 requarement이 ngrams을 만들려면이 작업 from nltk.util import ngrams
NLTK를 사용하여 이와 같은 그래프를 플로팅하고 싶습니다. 그러나 NLTK에서 그런 예가 어디 있는지 모르겠습니다. 아무도 그러한 종류의 수치를 그릴 NLTK 예제 코드를 보여줄 수 있습니까? 감사. http://universaldependencies.org/introduction.html
내가 IPython/Jupyter 노트북에 NLTK을 배우고, 파이썬 3 * 을 iterable`되지 나는 nltk.download_shell()를 실행하고 l을 사용할 수 있습니다 명령을 list 모든 패키지에. 나는 문제없이 전체 목록을 통해 페이지에 Enter을 입력했다. 오늘은 nltk.download_shell()입니다. 모든 '패키지'카테고리를
에서 같은 뿌리에서 파생 된 경우 나 함수 True 때 word1 및 word2이 같은 어근에서 파생 된 두 개의 영어 단어를 반환 same_base(word1, word2)을 쓰고 싶습니다 결정. 나는 단어가 여러 가지 감각을 가질 수 있다는 것을 알고있다. 알고리즘이 지나치게 복잡해지기를 원하면 가능하면 언제든지 True을 반환하고 같은 위치에서 나온
의도는 POS 태그를 기반으로합니다. 아래 링크를 통해이 태그를 얻을 수 있습니다. How can I best determine the correct capitalization for a word? 유사한 결과를 이용하여 적응 달성하려고? def truecase(doc):
truecased_sents = [] # list of truecased s