0

NLTK의 NER 기능을 사용하려고했습니다. 나는 기사에서 그런 실재물을 추출하고 싶다. 나는 그렇게하는 것이 완벽 할 수는 없다는 것을 알고 있지만 NE에 수동으로 태그를 달기위한 인간의 개입이 있는지 궁금하다.NLTK NER : 연속 학습

그렇다면 NLTK의 현재 모델이 지속적으로 모델을 학습 할 수 있습니까? (세미 감독 훈련)

+0

짧은 답변, 아니요. =) – alvas

+0

지속적인 교육을 지원하는 다른 도구에 대해 알고 있습니까? – mousecoder

+0

죄송 합니다만 NLTK에 확실하게 알지 못합니다. 수동 주석을 지원하지 않습니다. 누군가 NLTK 용 GUI 래퍼를 코딩 할 때까지는 지원하지 않습니다. NLP에서의 인간 상호 작용은 일반적으로 일종의 GUI가 필요하기 때문에 항상 코드 작성이 어렵습니다. – alvas

답변

1

nltk에서 제공되는 일반 바닐라 NER 청크는 ACE 코퍼스에서 교육 된 최대 엔트로피 청크를 내부적으로 사용합니다. 따라서 자신의 분류 자 ​​및 데이터로 훈련하지 않는 한 날짜 또는 시간을 식별 할 수 없습니다 (이는 매우 세심한 작업 임).

동일한 수행을 위해이 link을 참조 할 수 있습니다.

또한 nltk_contrib에는 timex이라는 모듈이있어 필요에 따라 도움을받을 수 있습니다.

Java에서 동일한 작업을 수행하려는 경우 Stanford SUTime을 더 자세히 살펴 보려면 Stanford CoreNLP의 일부입니다.

관련 문제