2014-02-18 2 views
0

에세이에서 신원을 제거하기 위해 스탠포드너를 사용하고 있습니다.명명 된 엔티티 인식

Werner와 같은 이름을 감지하고 있지만 램, shyam 등의 인도 이름은 탐지되지 않습니다.

알아볼 수 있도록해야 할 일.

답변

1

인도 이름에 대해 NER를 교육해야합니다. 그것을 달성하는 방법에 대한 자세한 정보를 찾을 수 없었습니다. 그러나이 FAQ 페이지 (http://nlp.stanford.edu/software/crf-faq.shtml#a)에는 시작점 일 수있는 몇 가지 정보가 있습니다. 특히 질문 2-3은 귀하의 질문과 직접 ​​관련이 있습니다.

+0

제공하신 정보가 유용했습니다. 하지만 나는 처음부터 분류자를 훈련시키고 싶지 않습니다. 기존의 분류 자 ​​파일에 인디언 이름을 추가하고 싶습니다. –

관련 문제