POS에 nltk.pos_tag()라는 단어가 태그되어 있으므로 treebank 태그가 주어집니다. 나는이 단어들을 알려진 POS 태그를 사용하여 음표 화하고 싶지만 어떻게 확신 할 수는 없다. 내가 Wordnet lemmatizer보고 있었는데, 나는 lemmatizer에 의해 허용 된 태그 treebank POS 태그를 변환하는 방법을 잘 모르겠습니다. 어떻게이 변환을 간단하게 수행 할 수 있습니까? 아니면 treebank 태그를 사용하는 lemmatizer가 있습니까?POS 태그가있는 단어를 NLTK로 대체 하시겠습니까?
답변
wordnet lemmatizer는 4 가지 부분 (ADJ, ADV, NOUN 및 VERB)만을 인식하며 NOUN 및 VERB 규칙 만 특히 흥미로운 작업을 수행합니다. treebank 태그 세트의 명사 품사는 모두 NN으로 시작하고 동사 태그는 모두 VB로 시작하고 형용사 태그는 JJ로 시작하고 부사 태그는 RB로 시작합니다. 그래서, 다른 레이블의 한 세트에서 변환하는 것은 매우 간단합니다, 뭔가 같은 :
from nltk.corpus import wordnet
morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]]
위성 형용사는 어떨까요? – user1048677
위성 형용사는 일반 형용사와 동일하게 취급됩니다. – rmalouf
어디에서 [penn_tag]를 가져 오나요? Treebank 태그 목록? – Ksofiac
- 1. nltk로 맞춤 태그 지정
- 2. PHP의 정규 표현식을 사용하여 태그 외부의 단어를 선택적으로 대체 하시겠습니까?
- 3. Javascript Regex : 여러 단어를 모든 항목의 공백으로 대체 하시겠습니까?
- 4. Stanford POS-Tagger의 숙련 된 모델에 태그가 추가 된 단어를 추가하려면 어떻게합니까?
- 5. 태그가있는 UIProgressView에 애니메이션을 적용 하시겠습니까?
- 6. POS 용 POS 시스템 (.NET 용)
- 7. JAXMServlet을 대체 하시겠습니까?
- 8. Python- *로 대체 하시겠습니까?
- 9. Astoria Payload를 대체 하시겠습니까?
- 10. Android에서 AbsoluteLayout을 대체 하시겠습니까?
- 11. Javascript에서 window.sessionStorage를 대체 하시겠습니까?
- 12. "grep -R"대체 하시겠습니까?
- 13. Stanford POS Tagger의 공동 배치 식별?
- 14. 파이썬리스트/사전에서 값을 대체 하시겠습니까?
- 15. java에서 mod_dav_svn을 (를) 대체 하시겠습니까?
- 16. 내부 결합을에서 선택으로 대체 하시겠습니까?
- 17. PHP 정규 표현식을 대체 하시겠습니까?
- 18. SQLite를 SQL Server로 대체 하시겠습니까?
- 19. decidePolicyForNavigationAction을 다음에서 대체 하시겠습니까? 처음보기에서
- 20. 일치하지 않는 java.util.regex.Matcher.replaceAll 대체 하시겠습니까?
- 21. 경로의 공백 문자를 대체 하시겠습니까?
- 22. Sed가 줄 바꿈을 대체 하시겠습니까?
- 23. JComboBox/BasicComboBoxUI를 빠르게 대체 하시겠습니까?
- 24. emacs에서 매크로를 쿼리 대체 하시겠습니까?
- 25. PIL에서 단일 색상을 대체 하시겠습니까?
- 26. OS X에서 cstring을 대체 하시겠습니까?
- 27. PHP의 __autoload 기능을 대체 하시겠습니까?
- 28. Django : 양식 저장을 대체 하시겠습니까?
- 29. POS 프린터 MatrixPoint MP-3250 ESC/POS 명령
- 30. 내용 : "$ ("# somediv ") .ss ('top', pos> 0? pos : 0);" 평균
내가 '김 POS' – fizzer
으로이 글을 읽을 몇 가지 힌트는 여기에도 사용할 수 있습니다 http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik