나는 Bangla 용 Maltparser 모델을 교육하려고합니다. Conllu 형식의 작은 코퍼스에 주석을 달았습니다. 하지만 그것은 나를 null 포인터 오류를 제공합니다. 그래서 나는 UD 웹 사이트에서 수집 한 treebank를 가지고 그것을 시도했습니다. 그리고 그 데이터 세트에서 작동합니다. 내 질문은 내가 UPOSTAG 필드를 주석하고 XPOSTAG 필드는 UPOSTAG의 단지 사본이다,교육 관련 문제 Maltparser Model
내가 XPOSTAG없이 Maltparser 모델을 학습 할 수 있습니다. XPOSTAG에 주석을 달 필요가 있습니까? 이것은 내 treebank와 UD treebank의 유일한 차이점입니다
자동으로 UPOSTAG를 XPOSTAG로 변환 할 수 있습니까?
심판 : http://universaldependencies.org/format.html 내가 모두 내 은행 및 UD 은행의 예를 제공하고 더 나은 이해를 위해
내 예 은행 (언어 벵골어입니다)
(실수와 약간의 빈 필드가 있습니다)1 Ajake _ NOUN NOUN _ 5 iobj _ _
2 rAtera _ NOUN NOUN _ 1 nmod _ _
3 AbahAoYA _ NOUN NOUN _ 5 nsubj _ _
4 kemana _ ADV ADV _ 5 advmod _ _
5 hate _ VERB VERB _ 0 root _ _
6 pAre _ AUX AUX _ 5 aux _ SpaceAfter=No
7 ? _ _ _ _ _ _ _ _
1 Ajake _ NOUN NOUN _ 5 iobj _ _
2 bikAlera _ NOUN NOUN _ 1 nmod _ _
3 paribesha _ NOUN NOUN _ 5 nsubj _ _
4 kemana _ ADV ADV _ 5 advmod _ _
5 hate _ VERB VERB _ 0 root _ _
6 pAre _ AUX AUX _ 5 aux _ SpaceAfter=No
7 ? _ _ _ _ _ _ _ _
UD 은행
1 From _ ADP IN _ 3 case _ _
2 the _ DET DT _ 3 det _ _
3 AP _ PROPN NNP _ 4 nmod _ _
4 comes _ VERB VBZ _ 0 root _ _
5 this _ DET DT _ 6 det _ _
6 story _ NOUN NN _ 4 nsubj _ _
7 : _ PUNCT : _ 4 punct _ _
1 President _ PROPN NNP _ 2 compound _ _
2 Bush _ PROPN NNP _ 5 nsubj _ _
3 on _ ADP IN _ 4 case _ _
4 Tuesday _ PROPN NNP _ 5 nmod _ _
5 nominated _ VERB VBD _ 0 root _ _
6 two _ NUM CD _ 7 nummod _ _
7 individuals _ NOUN NNS _ 5 dobj _ _
8 to _ PART TO _ 9 mark _ _
9 replace _ VERB VB _ 5 advcl _ _
10 retiring _ VERB VBG _ 11 amod _ _
11 jurists _ NOUN NNS _ 9 dobj _ _
12 on _ ADP IN _ 14 case _ _
13 federal _ ADJ JJ _ 14 amod _ _
14 courts _ NOUN NNS _ 11 nmod _ _
15 in _ ADP IN _ 18 case _ _
16 the _ DET DT _ 18 det _ _
17 Washington _ PROPN NNP _ 18 compound _ _
18 area _ NOUN NN _ 14 nmod _ _
19 . _ PUNCT . _ 5 punct _ _