2014-12-19 2 views
2
내가 NLTK3을 사용하여 아랍어 텍스트 분류에서 일하고 있어요

는 .. 난 당신이 버그를NLTK3 오류를 사용하는 텍스트 분류?

"calssifier =NaiveBayesClassifier.train(train_set) 
    File "/usr/local/lib/python2.7/dist-packages/nltk/classify/naivebayes.py", line 194, in train 
    for fname, fval in featureset.items(): 
AttributeError: 'unicode' object has no attribute 'items'" 

감사

답변

0

오류 메시지를 파악하는 데 도움이 바랍니다 수 있습니다, 다음과 같은 오류가 발생했습니다

'unicode' object has no attribute 'items'" 

items 메서드를 사용하는 dict-like 개체 여야하는 경우 unicode임을 의미합니다.

더 많이 말하려면 minimal example을 게시해야합니다. 그러면 오류가 악용됩니다. 그것은 DICT 있었어야 할 때

classifier = nltk.NaiveBayesClassifier.train(train_set) 
+0

고맙습니다. 나는 ch6에서 같은 예를 따랐다. 나는 정확도 1.0을 얻었다. 그럴 수 없다. 나는 다른 사용법을 가지고 있으며, 각 검토가 이미 그 측면을 가지고있는 리뷰로 훈련을 받았다. 테스트 리뷰의 측면을 결정할 수있는 분류자를 만들고 싶습니다. 품사 태깅을 기능으로 사용하겠습니다. 나는 feature 함수를 만들었지 만,이 함수를 분류 자에 넣는 방법을 이해할 수는 없습니까? , 나는 test_set도 train_set과 같은 dict로 형성되어야한다는 것을 알아 차렸다. –

+0

예를 들어주세요 –

1

train_set를 사용하여 예를 들어 chapter 6 of the NLTK book를 참조하십시오, 문자열입니다.

+0

예를 들어 줄 수 있습니다 –

+1

OP는 'train_set = { "items": "something"대신'train_set = "something"'을 설정했습니다. 사소한 오류. – dmvianna