이전에 POS 주석이없는 언어의 코퍼스가 있습니다. 즉, 기존 태그 세트가 없습니다. 수동으로 메모장과 같은 워드 프로세서로 태그를 지정하는 것 외에도, 자동 코덱과 같은 새로운 태그가 지정되지 않은 세트에 태그를 지정하는 자동 방법이 있습니까? 감사합니다. .새 태그 세트를 작성하는 방법
0
A
답변
0
태그 집합의 세부 묘사 정도에 따라 다릅니다. 10-12 기본 POS (명사, 형용사, ..., 외국어, 구두점) 또는보다 상세한 (구별되는 동사 형식, 대명사 유형, 성별, 수, 시제, ...).
전자는 거의 보편적입니다 (the categories of the Multext-East tagset 또는 Google의 보편적 인 태그 세트 참조).
후자는 훨씬 더 복잡합니다. 약 paper입니다. 즉, 우리는 tagsets에 대한 템플릿을 가지고 있으며, 특정 언어에 맞게 카테고리와 값을 추가/삭제합니다. 주석에 관한
는 : 다시, 그것은 의존 - 방금 수동으로 각 단어에 태그를 지정할 수있는 작은 태그 세트가있는 경우, 메모장이나 간단한 GUI (우리가 this one를 사용하지만, 아마도 더 나은 사람이있다)에서 말한다. 수천 또는 수천 개의 태그가있는 태그 세트가 있다면 아마 더 나은 지원을 원할 것입니다. 가장 좋은 방법은 분석기가 제안하는 옵션 중에서 선택할 수있는 (아마도 과장 된) 형태소 분석기와 GUI를 사용하는 것입니다.
0
Brat에는 수동 주석을위한 매우 훌륭한 GUI가 있습니다.
관련 문제
- 1. 데이터 세트를 작성하는 경우
- 2. g : select 태그에 대한 세트를 작성하는 방법
- 3. Java에서 XML 정보 세트를 작성하는 방법
- 4. 새 뷰 탐색기를 작성하는 방법
- 5. 두 세트를 비교하는 함수를 작성하는 방법은 무엇입니까?
- 6. 유연한 인라인 형식 세트를 작성하는 방법은 무엇입니까?
- 7. 닫는 본문 태그 뒤에 요소를 작성하는 방법
- 8. 계층 구조의 클래스에서 태그 목록을 작성하는 방법
- 9. 루트 요소의 전체 중첩 세트를 새 트리로 복사/복제하는 방법
- 10. 읽기 및 쓰기 별도의 몽고 복제본 세트를 작성하는 방법
- 11. 다른 컨테이너에 다른 세트를 저장할 수있는 루프를 작성하는 방법 :
- 12. R에서 맞춤형 데이터 세트를 작성하는 방법은 무엇입니까?
- 13. zend db에서 업데이트 세트를 작성하는 방법은 무엇입니까?
- 14. 대규모 SQL 테이블에 새 인덱스를 작성하는 방법
- 15. Ruby - 스크립트 출력으로 새 파일을 작성하는 방법
- 16. QuikcBlox 고객 테이블에 새 레코드를 작성하는 방법
- 17. 기존 모델에서 새 Sails 모델을 작성하는 방법
- 18. PSObject 오브젝트의 새 복제 인스턴스를 작성하는 방법
- 19. Hadoop Reducer에서 새 고유 키를 작성하는 방법
- 20. 새 활동을 열기위한 문자열을 작성하는 방법
- 21. Apache Nifi를 사용하여 새 플로우를 작성하는 방법
- 22. Cakephp 태그 지정 - 자동 저장 새 태그 및 태그 관계
- 23. NLTK에서 갈색 태그 세트를 사용하여 POS 태그 지정
- 24. jsp 태그 라이브러리를 작성하는 것
- 25. 정규식 내가 XML의 샘플 세트를 태그
- 26. Subversion에서 새 트렁크에 태그 만들기
- 27. 강한 태그 새 줄
- 28. 맞춤 바인딩에 새 태그 추가
- 29. 일부 조건에 따라 새 세트를 구성하려면 어떻게해야합니까?
- 30. Android Studio에 새 아이콘 세트를 만드시겠습니까?
코퍼스의 언어는 무엇입니까? – mbatchkarov
또한 "비표준 방식"으로 "태그 세트"라는 용어를 사용하고 있습니다. 태그 집합은 언어 **에있는 모든 부분의 음성입니다. 예를 들어 영어는 종종 Penn 태그 세트를 사용하여 분석됩니다. 즉, 코퍼스의 각 단어에 Penn 태그 세트의 태그 중 하나가 지정됩니다. 언어 학자들은 언어가 갖는 품사에 대해 종종 동의하지 않기 때문에 언어마다 여러 개의 태그 세트를 사용할 수 있습니다. – mbatchkarov
정정 보내 주셔서 감사합니다. . .tag 세트. – Iykeln