2012-04-26 4 views
4

NLTK 명명 된 엔터티 태그 지정자를 사용하여 다양한 명명 된 엔터티를 식별하려고합니다. Python을 사용한 Natural Language Processing에서는 DATE June, 2008-06-29 및 TIME 두 오십 오 m, 오후 1시 30 분을 포함하여 일반적으로 사용되는 명명 된 엔티티의 목록을 제공합니다 (호기심에 있다면 표 7.4). 그래서 NLTK의 엔티티 타거 (entity tagger)로이 작업을 수행 할 수 있다는 인상을 받았습니다.nltk를 사용하여 날짜를 명명 된 엔티티로 인식합니까?

그러나 타거를 실행하면 사람이나 조직처럼 날짜 또는 시간을 전혀 인식하지 못하는 것 같습니다. NLTK라는 엔티티 태그러가 이러한 날짜/시간 사례를 처리하지 않습니까? 아니면 특정 날짜/시간 형식 만 선택합니까? 이 사건을 처리하지 못한다면 아무도 그 시스템을 알 수 있습니까? 아니면 내 유일한 솔루션을 만들 수 있습니까?

감사합니다.

답변

10

당신은 NLTK의있는 contrib 저장소를 체크 아웃해야이 - 모듈이라고 timex.py을 포함하거나 여기에서 다운로드 : https://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

을 모듈의 첫 번째 줄에서 :

 
# Code for tagging temporal expressions in text 
+0

이 아름답게 작동합니다. 고맙습니다! – greatblue

+1

예 : 'June 23rd, 2016'과 같이 명시적인 날짜와 시간에는 제대로 작동하지 않습니다 – lenhhoxung

+0

@lenhhoxung 더 좋은 해결책을 찾았습니까? –

관련 문제