NER 및 POS 태깅을 이해하기 위해 Stanford CoreNLP를 확인했습니다. 하지만 엔티티 용 맞춤 태그를 만들고 싶은데 <title>Nights</title>, <genre>Jazz</genre>, <year>1992</year>
어떻게 할 수 있습니까? 이 경우 CoreNLP가 유용합니까?맞춤 NER 및 POS 태깅
4
A
답변
4
CoreNLP는 PERSON, LOCATION, ORGANIZATION, MISC, DATE, TIME, MONEY, NUMBER 등 언급 된 유형으로 제한됩니다. 아니, 당신은 그냥 "직관적"이 실제로
을 :) 할 수있는 가정하여 다른 엔티티를 인식 할 수 없습니다, 당신은 선택해야 어느 것 :- 다른 NER 시스템을 찾기 그 유형에 해당하는 태그
- 지식 기반/감독되지 않은 접근법을 사용하여이 태깅 작업을 처리합니다.
- 인식하려는 유형이 포함 된 추가 자원 (코퍼)을 검색하고 감독 된 NER 시스템 (CoreNLP 또는 기타)을 다시 훈련하십시오.
- 자신의 자원을 빌드하고 주석을 달 수 있습니다. 주석 체계, 규칙 등 - 작업의 꽤 흥미로운 부분!
실제로 기존 시스템이 사용자의 요구를 충족시키지 못하면 약간의 노력이 필요합니다. 감독되지 않은 접근법은 시스템을 부트 스트래핑하는 데 도움이 될 수 있으므로 전용 코퍼스를 찾고/주석을 달아야하는지 확인해야합니다. 후자의 경우, 결과 데이터가 보이지 않는 데이터에 대해 얼마나 많은 양을 수행하는지 평가할 수 있도록 train/dev/test 파트로 데이터를 분리하는 것이 좋습니다.
1
CRF 분류기를 사용하여 모델을 새로운 수업에 대해 훈련 시키려면이 FAQ (http://nlp.stanford.edu/software/crf-faq.shtml)를 살펴보십시오. 유용 할 수 있습니다.
관련 문제
- 1. jvntextpro로 POS 태깅
- 2. NLTK를 사용하는 POS 태깅 POS 텍스트
- 3. Weka POS 태깅 + 토큰 화
- 4. Mallet POS 태깅 학습 시간
- 5. POS 태깅 등의 약어는 무엇을 의미합니까?
- 6. POS 태깅 전에 스팸 필터링을 사용해야합니까?
- 7. 맞춤 POS 태그와 spacy
- 8. android의 지오 태깅 및 지오 태깅
- 9. Smice 맞춤 프린터 & Openbravo pos
- 10. Baum Welch 알고리즘의 구현 디버깅 (POS 태깅 용)
- 11. POS 태깅 성능이 느립니다. 어떤 종류의 예열을 할 수 있습니까?
- 12. NLTK (pos 태깅)를 사용하여 동사의 부정형을 얻는 방법
- 13. stanfordNLP에서 아랍어 POS POS 태깅을 구성하는 방법
- 14. 브랜치 및 태깅 SVN
- 15. CVS 및 SVN 태깅
- 16. jquery 수학 플립 pos neg 및 pos negate pos
- 17. POS 태깅으로 중지 단어를 제거해야합니까?
- 18. CoreNLP : pos 태그 제공
- 19. 변환 기반 품사 태깅 (브릴 태깅)
- 20. NER 분류자를 위해 이전에 태그가 지정된 NER 코퍼스 NER 분류 자
- 21. Stanford NER : 기존 NER 모델에 자체 태그를 추가하는 방법은 무엇입니까?
- 22. NLTK NER : 연속 학습
- 23. 스탠포드 NER - MISC 실체?
- 24. 관계가있는 태깅 시스템
- 25. 사진 태깅 시스템
- 26. Sitecore 멀티 레이어 태깅
- 27. Markdown의 시맨틱 태깅
- 28. 태깅 시스템의 출발점 찾기
- 29. Android에서 Sentiment Analysis (POS 태깅 등)를 수행 할 수 있습니까?
- 30. 튜토리얼의 태깅 단계?
예, CoreNLP는 맞춤 '태그'를 사용할 수 있습니다. '연도'는 이미 날짜로 표시되어야합니다. 가제트 기능을 사용하면 쉽게 할 수 있습니다. 여러 번 문서를주의 깊게 읽어야합니다. –