python2.7, nltk 3.2.1 및 python-crfsuite 0.8.4를 사용하고 있습니다. 나는이 페이지를 따르고있다 : nltk.tag.crf 모듈을위한 http://www.nltk.org/api/nltk.tag.html?highlight=stanford#nltk.tag.stanford.NERTagger. 난 그냥이TypeError : NLTK에서 str이 아닌 유니 코드 여야합니다
from nltk.tag import CRFTagger
ct = CRFTagger()
train_data = [[('dfd','dfd')]]
ct.train(train_data,"abc")
을 실행에
파이썬 2에서, 나는이 너무f = open("abc","wb")
ct.train(train_data,f)
그러나 나는 다음과 같은 오류를 얻고 시도
File "C:\Python27\lib\site-packages\nltk\tag\crf.py", line 129, in <genexpr>
if all (unicodedata.category(x) in punc_cat for x in token):
TypeError: must be unicode, not str
"abc"에 데이터를 표시 할 수 있습니까? 오류에 따라 귀하의 문제가 거짓말 ... –