1
스탠포드 파서 (Stanford Parser, http://nlp.stanford.edu/software/lex-parser.shtml)는 문맥없는 구문 구조 트리를 다음과 같이 제공합니다. 나무에있는 모든 명사구 (NP)와 동사구 (NP) 같은 것을 추출하는 가장 좋은 방법은 무엇입니까? 이 같은 구조를 읽을 수있는 Python (또는 Java) 라이브러리가 있습니까? 고맙습니다.스탠포드 파서 (Stanford Parser)의 컨텍스트 프리 구문 구조 출력에서 정보 추출
(ROOT
(S
(S
(NP
(NP (DT The) (JJS strongest) (NN rain))
(VP
(ADVP (RB ever))
(VBN recorded)
(PP (IN in)
(NP (NNP India)))))
(VP
(VP (VBD shut)
(PRT (RP down))
(NP
(NP (DT the) (JJ financial) (NN hub))
(PP (IN of)
(NP (NNP Mumbai)))))
(, ,)
(VP (VBD snapped)
(NP (NN communication) (NNS lines)))
(, ,)
(VP (VBD closed)
(NP (NNS airports)))
(CC and)
(VP (VBD forced)
(NP
(NP (NNS thousands))
(PP (IN of)
(NP (NNS people))))
(S
(VP (TO to)
(VP
(VP (VB sleep)
(PP (IN in)
(NP (PRP$ their) (NNS offices))))
(CC or)
(VP (VB walk)
(NP (NN home))
(PP (IN during)
(NP (DT the) (NN night))))))))))
(, ,)
(NP (NNS officials))
(VP (VBD said)
(NP-TMP (NN today)))
(. .)))