2017-02-24 5 views
-1

나는 Bangla 용 Maltparser 모델을 교육하려고합니다. Conllu 형식의 작은 코퍼스에 주석을 달았습니다. 하지만 그것은 나를 null 포인터 오류를 제공합니다. 그래서 나는 UD 웹 사이트에서 수집 한 treebank를 가지고 그것을 시도했습니다. 그리고 그 데이터 세트에서 작동합니다. 내 질문은 내가 UPOSTAG 필드를 주석하고 XPOSTAG 필드는 UPOSTAG의 단지 사본이다,교육 관련 문제 Maltparser Model

  1. 내가 XPOSTAG없이 Maltparser 모델을 학습 할 수 있습니다. XPOSTAG에 주석을 달 필요가 있습니까? 이것은 내 treebank와 UD treebank의 유일한 차이점입니다

  2. 자동으로 UPOSTAG를 XPOSTAG로 변환 할 수 있습니까?

심판 : http://universaldependencies.org/format.html 내가 모두 내 은행 및 UD 은행의 예를 제공하고 더 나은 이해를 위해

내 예 은행 (언어 벵골어입니다)

(실수와 약간의 빈 필드가 있습니다)
1 Ajake _ NOUN NOUN _ 5 iobj _ _ 
2 rAtera _ NOUN NOUN _ 1 nmod _ _ 
3 AbahAoYA _ NOUN NOUN _ 5 nsubj _ _ 
4 kemana _ ADV ADV _ 5 advmod _ _ 
5 hate _ VERB VERB _ 0 root _ _ 
6 pAre _ AUX AUX _ 5 aux _ SpaceAfter=No 
7 ? _ _ _ _ _ _ _ _ 

1 Ajake _ NOUN NOUN _ 5 iobj _ _ 
2 bikAlera _ NOUN NOUN _ 1 nmod _ _ 
3 paribesha _ NOUN NOUN _ 5 nsubj _ _ 
4 kemana _ ADV ADV _ 5 advmod _ _ 
5 hate _ VERB VERB _ 0 root _ _ 
6 pAre _ AUX AUX _ 5 aux _ SpaceAfter=No 
7 ? _ _ _ _ _ _ _ _ 

UD 은행

1 From _ ADP IN _ 3 case _ _ 
2 the _ DET DT _ 3 det _ _ 
3 AP _ PROPN NNP _ 4 nmod _ _ 
4 comes _ VERB VBZ _ 0 root _ _ 
5 this _ DET DT _ 6 det _ _ 
6 story _ NOUN NN _ 4 nsubj _ _ 
7 : _ PUNCT : _ 4 punct _ _ 

1 President _ PROPN NNP _ 2 compound _ _ 
2 Bush _ PROPN NNP _ 5 nsubj _ _ 
3 on _ ADP IN _ 4 case _ _ 
4 Tuesday _ PROPN NNP _ 5 nmod _ _ 
5 nominated _ VERB VBD _ 0 root _ _ 
6 two _ NUM CD _ 7 nummod _ _ 
7 individuals _ NOUN NNS _ 5 dobj _ _ 
8 to _ PART TO _ 9 mark _ _ 
9 replace _ VERB VB _ 5 advcl _ _ 
10 retiring _ VERB VBG _ 11 amod _ _ 
11 jurists _ NOUN NNS _ 9 dobj _ _ 
12 on _ ADP IN _ 14 case _ _ 
13 federal _ ADJ JJ _ 14 amod _ _ 
14 courts _ NOUN NNS _ 11 nmod _ _ 
15 in _ ADP IN _ 18 case _ _ 
16 the _ DET DT _ 18 det _ _ 
17 Washington _ PROPN NNP _ 18 compound _ _ 
18 area _ NOUN NN _ 14 nmod _ _ 
19 . _ PUNCT . _ 5 punct _ _ 

답변

0

좋아, 첫 번째 문제에 대한 해결책을 찾았습니다. XPOSTAG가 필요 없기 때문에 UPOSTAG를 복제하면 교육을받을 수 있습니다. 내 문제는 단어 나 구두점이 없다는 것이었다. " 질문에 pos 태그가 있어야하며 루트에 의존해야합니다. 그것은 내 문제를 해결했다.

두 번째 질문의 경우 대답이 모호합니다. UPOSTAG과 XPOSTAG 사이에는 유효한 언어가 있으므로 유효한 일대일 관계는 없습니다. Penn Tree Bank 태그를 사용하는 모든 테이블이 작동합니다. 그러나 정확성을 위해 사후 처리가 필요할 것입니다.