2016-07-21 5 views

답변

0

귀하의 입력 내용이 숙련 된 Corenlp 모델과 다른 도메인에있는이 도메인 적응 문제입니다.

이 문제를 해결하는 가장 간단한 방법은 스탠포드 Corenlp를 사용하기 전에 입력을 표준화하는 것입니다 (예 : twitter 정규화 도구 사용, 예 : http://www.cs.cmu.edu/~ark/TweetNLP/). 정규화는 약간 도움이되지만 문제를 완전히 해결하지는 못합니다.

자원과 돈이 더 많은 경우 크라우드 소싱을 사용하여 데이터에 라벨을 지정하고이 작업을 위해 자신의 모델을 학습 할 수 있습니다.

관련 문제