2016-09-30 3 views
0

맞춤 NER 사전 맵 파일을 사용하여 Stanford CoreNLP를 사용해 보겠습니다. 그것은 상당히 성공적입니다. 하지만 DATE, NUMBER와 같은 기본 Stanford NER 엔티티를 계속 사용하고 있습니다.이 엔티티는 맞춤 NER 사전에 포함되어 있지 않습니다. 그것을 끌 수 있습니까?Stanford CoreNLP NUMBER 엔티티를 제거하십시오.

예 : 도요타 : NER = 조직, 알 티스 : NER = 차량, 2.0 : NER = 번호

도요타 알 티스 2.0

스탠포드 결과 (사용자 정의 NER 사전 맵 파일에 있음) 내 예상 결과 : 도요타 : NER = 조직, 알 티스 : NER = 차량, 2.0 : NER = 차량

가 어떤 속성 그게 내가 SW에 입력을 할 수 있습니다 엔티티 DATE와 NUMBER가 생성됩니다.

미리 감사드립니다.

답변

1

나는이 문제를 해결할 수있었습니다. 숫자 및 날짜 관련 기관을 방지하기 위해, 당신은 당신의 자바 코드에서 다음 매개 변수를 설정해야 볼 수

props.put("ner.useSUTime","false");//do not load the default SUTime models from Stanford 
 
props.put("ner.applyNumericClassifiers","false");//do not use numeric from Stanford

감사합니다.

관련 문제