2013-04-13 2 views
4

종속 절, 본 절, 관련 절, 제한적인 관련 절, 비 제한적 상대 절을 문장에서 추출하고 싶지만이 작업을 수행하는 방법을 모르겠습니다.추출 절 양식 문장

"나는 처음 90 년대 초반 파리에서 살았습니다."
[주 조항] [관련 조항]

"그녀는 상처받은 손을 밖으로 내밀었다."
[주요 절] [제한적인 관련 절]

이 작업을 도와 주시겠습니까?

답변

3

선거구 분석과 함께이 정보를 합리적인 정확성으로 추출 할 수 있어야합니다. here으로 나열된 여러 가지 구현이 있습니다. 그 목록에, 나는 내 자신을 추가하여 다운로드 할 수 있습니다. here. 다른 어떤 고 정확도 파서보다 빠르며 합리적으로 잘 문서화됩니다 (연구 코드 용).

+1

답변 해 주셔서 감사합니다. 스탠포드 파서 (Stanford parser)의 문서를 읽었지 만 문장에서 주요 절을 얻는 프로그램을 작성하는 법을 모르겠습니다. 제게 파서 (parser) 또는 다른 사람들과 함께 Java에서 문장의 주요 절을 얻는 방법을 안내해주십시오. – SahelSoft

+1

Penn Treebank 주석 스타일에서 절은 일반적으로 'S'로 표시됩니다. 트리의 상단에있는 'S'노드는 일반적으로 주절이되며 포함 된 'S'노드는 보조 노드입니다. 물론, 조각 (FRAG) 및 기타 관련 레이블 (SBAR, SBARQ 등)에 의해 혼란 스럽습니다. Penn Treebank Annotation Guidelines를 살펴보고 응용 프로그램에 대해 '주'및 '자회사'로 간주하는 레이블에 대한 자신 만의 추론을 만들려고합니다. – AaronD