2011-03-12 4 views
7

한국어, 인도네시아어, 태국어 및 베트남어에 대해 오픈 소스 POS 타거를 권장 할 수 있습니까?한국어, 태국어 및 인도네시아어 POS 타가

저는 현재 가지고있는 자료 자료에 태그를 붙일 수 있습니다. (예 : the stanford-postagger)

개발자가 POS 튜너를 공유하고 공유하도록 신경을 쓰는 경우 나도 신경 ​​쓰지 않습니다. 출력의 일부 수정과 함께

, 나는 POS는 jvntextpro

과 베트남 데이터를 태그 한하지만 좋겠 아직 한국어에 대한 입력과 같은, 인도네시아어, 태국어 POS 태그. ACL 위키 후

답변

5

: Korean morphological analyzer and part-of-speech tagger

나는 한국, 태국, 한국에서 NLP 연구 부서의 웹 사이트에보고 시작합니다. On this page, 당신은 연구 부서에 대한 링크를 찾을 수 있습니다.

행운을 빈다.

업데이트 : OpenNLP에는 태국어 PoS가 있습니다. 다음은 모델입니다 : PoS opennlp tagger 용 http://opennlp.sourceforge.net/models/thai/.

+0

http://isoft.postech.ac.kr/Course/CS730b/2005/index.html이 페이지에서 한국어 타게져를 발견했습니다. 지금은 타이 태그가 없습니다. 하하 .. 페이지를 보내 주셔서 감사합니다.하지만 NLP 리소스를보다 잘 정리해야합니다. – alvas

0

RDRPOSTagger : POS 및 형태 학적 태깅을위한 강력하고 사용하기 쉬운 언어 독립적 툴킷을 사용해보십시오.

(프로그래밍 언어 : 파이썬 & 자바)

RDRPOSTagger 학습 및 태그 과정 모두에서 빠른 성능을 얻습니다. 또한 RDRPOSTagger는 최첨단 결과에 비해 매우 경쟁력있는 정확성을 제공합니다. this paper에서 성능 속도 및 태깅 정확도를 포함한 실험 결과를 확인하십시오.

RDRPOSTagger는 태국어 및 베트남어를 비롯한 13 개 언어에 대한 사전 교육 된 POS 및 모폴로지 태깅 모델을 지원합니다.

관련 문제