2013-04-05 4 views
2

자연어 처리에서 명명 된 엔티티 인식은 조직, 장소 및 가장 중요한 이름이 인 이름이 인 명명 된 엔티티를 인식하는 데 어려움이 있습니다.명명 된 엔티티 인식에서 동의어를 어떻게 해결할 수 있습니까?

가 나는 동의의 호출이 생각에 큰 도전이다 : 및 드라큘라이 같은 사람을 참조 사실에 백작은, 그러나 이것은 직접 논의되지 않습니다 가능성이 IT 본문.

이러한 동의어를 해결하는 가장 좋은 알고리즘은 무엇입니까?


어떤 Python 기반 라이브러리에도이 기능이 있다면, 나는 교육 받기를 열망하고 있습니다. 나는 NLTK를 사용하고있다.

답변

3

coreference resolution 및 명명 된 엔티티 연결 문제를 설명하고 있습니다. 나는 당신이 의미하는 것을 완전히 확신하지 못하기 때문에 별도의 링크를 제공하고 있습니다.

  • 코어 레퍼런스 : Stanford CoreNLP은 현재 최상의 구현 중 하나를 가지고 있지만 자바로되어 있습니다. python bindings을 사용했으며 너무 행복하지 않았습니다. 스탠포드 파이프 라인을 통해 모든 데이터를 한 번 실행 한 다음 파이썬에서 처리 된 XML 파일을로드했습니다. 분명히 실시간으로 처리해야하는 경우에는 작동하지 않습니다.
  • 명명 된 엔티티 링크 : Apache Stanbol과 다음 링크를 확인하십시오. Stackoverflow post.
+0

실행 중 ...? +1, 링크 덕분에 --- 연구를 돕고 있습니다 –

+0

죄송합니다. 업데이트 게시물 – mbatchkarov

+0

을 참조하십시오. 걱정하지 마세요. 걱정하지 마십시오. 좋은 생각입니다. –

관련 문제