nltk에서 음성 또는 POS 태그러를 사용하려고했지만 backoff를 사용하여 둘 이상의 ngram 태그 작성기에서 작동하지 못했습니다. 더 높은 점수를 얻기 위해 더 많은 태그를 사용하는 것으로 읽었지 만 저에게는 효과가 없습니다. 처음에는 더 많은 단어를 사용하고 하나는 사용하지 않기를 바랍니다. 나는이 같은백 오프 ngrams를 사용하여 nltk에서 태그 지정
import nltk
from nltk.corpus import brown
#sentence = brown.sents(categories = "news")
trains = brown.tagged_sents(categories = "news")
from nltk import NgramTagger
fortest = ["hi", "how","are", "you"]
tagger = (nltk.NgramTagger (n, trains, backoff=n-1) for n in range (3))
print tagger.tag(fortest)
을 그것을 시도하지만 나에게 오류 AttributeError를 제공합니다 : '발전기'개체가 어떤 속성이없는 '태그'를
그래서 내가리스트없이합니다
for n in range(3):
tagger = nltk.NgramTagger(n, trains, backoff=n-1)
그러나 다음을 얻습니다.
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/tag/sequential.py", line 271, in __init__
ContextTagger.__init__(self, model, backoff)
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/tag/sequential.py", line 121, in __init__
SequentialBackoffTagger.__init__(self, backoff)
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/tag/sequential.py", line 46, in __init__
self._taggers = [self] + backoff._taggers AttributeError: 'int' object has no attribute '_taggers'
저는 파이썬을 처음 사용하는 사람들에게 도움이됩니다.