2013-01-24 1 views
1

Stanford-NLP 및 CoreNLP로 텍스트를 분석하려고하면 성능이 매우 떨어집니다. CNN.com의 문서 처리에는 약 30 초가 소요됩니다.StanfordCoreNLP 및 시맨틱 그래프 성능 문제

나는 기본적으로이 코드는 다음과 같은 구성으로 StanfordCoreNLP의 단일 인스턴스를 생성

:

주석 자 = 토큰 화, ssplit는, pos가, 보조 정리는 넬이, sutime.binders dcoref, 구문 분석 = 0

나는 "ner, 구문 분석, dcoref"를 비활성화합니다. 성능이 매우 빠릅니다. 의미 그래프를 얻을 필요가 있기 때문에 직접 객체, 명사 등을 검색하기 위해 의미 그래프를 얻기 위해 성능이나 다른 방법을 최적화하는 방법이 있는지 궁금합니다.

답변

0

구문 분석 및 참조 분석 종종 느리지 만 불행하게도 parsedcoref 주석자를 실행하지 않고 CoreNLP의 의미 론적 그래프에서 제목 및 객체 정보를 얻을 수있는 방법이 없습니다. 즉, 스탠포드 CoreNLP는 적극적으로 개발되고 시간이 지남에 따라 점점 빨라지고 있습니다.