NLTK 음성 부분 태그를 실험하면서 nltk.pos_tag
으로 전화를 걸 때 많은 VBP
태그를 발견했습니다. 이 태그가 Brown Corpus의 연설 태그 세트에 없다는 것을 알았습니다. 그러나 그것은 UPenn 태그 세트의 일부입니다.음성 태그 세트의 기본 nltk 부분은 무엇입니까?
기본적으로 nltk는 어떤 태그 세트를 사용합니까? 나는 공식 문서 나 아피답 (apidocs)에서 이것을 발견 할 수 없다.
NLTK 음성 부분 태그를 실험하면서 nltk.pos_tag
으로 전화를 걸 때 많은 VBP
태그를 발견했습니다. 이 태그가 Brown Corpus의 연설 태그 세트에 없다는 것을 알았습니다. 그러나 그것은 UPenn 태그 세트의 일부입니다.음성 태그 세트의 기본 nltk 부분은 무엇입니까?
기본적으로 nltk는 어떤 태그 세트를 사용합니까? 나는 공식 문서 나 아피답 (apidocs)에서 이것을 발견 할 수 없다.
Ntlk는 PennTreebank 태그 세트를 사용합니다. 이 링크를 보시길. http://nltk.org/api/nltk.tag.html
Penn Treebank Project에서 사용되는 POS 태그를 사용합니다. 거기에 의미가있는 태그 목록을 볼 수 있습니다. "http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html"
Penn Treebank에서 훈련 된 것처럼 보입니다. https://github.com/nltk/nltk/blob/master/nltk/tag/__init__.py#L80 –