스탠포드 CoreNLP 파이프 라인을 사용하고 있으며 SentencesAnnotation에서 TreeAnnotation 및 BasicDependenciesAnnotation을 받고 있습니다.
POS 태그 및 종속성 구조에 대한 파서가 얼마나 확실한 지 알려줄 방법을 찾고 있습니다.스탠포드 NLP 주석 순위 또는 점수
나는 이전에 스탠포드 NLP 라이브러리를 조작하는 동안 동일한 문장에 대해 반환 된 순위가 다른 복수형 트리를 보았습니다. 파서 또는 파이프 라인에서이 정보를 가져 오는 방법에 대한 정보를 찾을 수 없습니다.
"DependencyScoring"클래스는 "TypedDependency"에서 작동하는 것으로 보이지만 주석 처리의 일부로 파이프 라인이 생성되는 것은 아닙니다.
편집 : 코드 세부 정보 :
Annotation document = new Annotation("This is my sentence");
pipeline.annotate(document);
List<CoreMap> sentences = document.get(SentencesAnnotation.class);
...
Tree tree = sentence1.get(TreeAnnotation.class);
SemanticGraph dependencies = sentence1.get(CollapsedCCProcessedDependenciesAnnotation.class);
어떻게 의존성 구문 분석을 작성합니까? 당신은'parse' 주석으로부터 그것들을 얻고 있습니까? 이 경우 종속성은 결정 성 전환에 의해 실제로 생성됩니다. 확률의 유일한 측정은 변환이 시작되는 PCFG 구문 분석에서 비롯됩니다. 이것이 사실이라면 나는 더 자세한 정보를 제공 할 수있다. –
기본적으로 "Annotation document = new Annotation ("This is my sentence "); pipeline.annotate (document); 목록 문장 = document.get (SentencesAnnotation.class);" 그런 다음 TreeAnnotation 및 Dependency Graph를 가져옵니다. 예, PCFG 방식에 대해 자세히 설명해주십시오. –
@JonGauthier 또한, 의존성 관계에서 단어 쌍의 우도/확률을 볼 수 있습니까? 예 : "MD"-> "JJ"또는 "will"-> "able"관계에 어떻게 걸릴 것입니까? 원하면 별도의 질문으로 게시 할 수 있습니다. –