2013-02-16 2 views
0

나는 maltparser으로 착수했습니다. 나는 명령 줄maltparser의 영어에 대한 사전 훈련 된 모델 적용시 오류가 발생했습니다

영어 문장을 구문 분석에 제공

사전 교육을받은 모델'engmalt.linear-1.7'을 적용 할.

은 내가 engmalt를 다운로드하고

'engmalt.linear-1.7에서 파일 이름을 변경했습니다. 우편 번호 '부터'engmalt.linear-1.7. mco '. 나는

'infile.conll'에서 (engmalt의 다운로드 페이지에서) 예를 들어 영어 문장

을 저장하고 명령 줄에서 실행됩니다.

나는 결과를 얻을 수없는 이상한 오류있다 : 라벨 'FORM'에 해당하는

없음 라벨 기호.

(그런데, 내가 테스트하는 경우 '

/maltparser-

1.7.1/예/데이터/talbanken05_test.conll'maltparser의이

패키지는 놀라 울 정도로 종속성을 얻을 수 있습니다!)

  • 1 : 'engmalt.linear'의 파일 이름 확장명을 변경해야합니까?

  • Q2 : 나는 'talbanken05_test.conll'을 구문 분석 engmalt을 사용할 수 있습니다 왜 (안

영어 문장)?

  • Q3 : 오류가있을 이유는 영어 문장을 해석 할 때에,

은 무엇을 의미 하는가?

고맙습니다.

+2

다운로드 페이지에서 복사 한 문장의 열을 구분하는 탭이 있습니까? – aab

+0

고마워, 그게 문제 야. :) –

답변

2

이것은 오래된 질문이며 OP가 여전히 답을 원하고 있는지 잘 모르겠습니다. 사전 학습 된 모델과 함께 사용해야하는 올바른 형식은이 xml에 정의 된 10 열 형식입니다.

<?xml version="1.0" encoding="UTF-8"?> 
<dataformat name="conllx"> 
    <column name="ID" category="INPUT" type="INTEGER"/> 
    <column name="FORM" category="INPUT" type="STRING"/> 
    <column name="LEMMA" category="INPUT" type="STRING"/> 
    <column name="CPOSTAG" category="INPUT" type="STRING"/> 
    <column name="POSTAG" category="INPUT" type="STRING"/> 
    <column name="FEATS" category="INPUT" type="STRING"/> 
    <column name="HEAD" category="HEAD" type="INTEGER"/> 
    <column name="DEPREL" category="DEPENDENCY_EDGE_LABEL" type="STRING"/> 
    <column name="PHEAD" category="IGNORE" type="INTEGER" default="_"/> 
    <column name="PDEPREL" category="IGNORE" type="STRING" default="_"/> 

</dataformat> 
관련 문제