2

텍스트를 읽도록 일부 자연어 처리 알고리즘을 연구 중이며 텍스트가 모임 요청을 제안하려고하는 것으로 보일 경우 해당 모임을 설정합니다 자동으로초대장 텍스트에서 시간, 날짜 및 장소를 감지하는 알고리즘

예를 들어, 전자 메일 텍스트를 읽는 경우 :.

"오후 7시에서

알고리즘 시내하자 대회 내일 곳은 시간을 감지 할 수 있어야한다, 날짜 장소 및 이벤트 장소

이 목적으로 사용할 수있는 기존 NLP 알고리즘을 아는 사람이 있습니까? 일부 NLP 리소스 (예 : NLTKsome tools in R)를 실행했지만 많은 성공을 거두지 않았습니다.

감사

+0

에보고해야합니까? 질문을 하향식으로 표기 할 때, 학습을 용이하게하기 위해 일을하는 올바른 방법을 우리에게 말할 수 있습니까? –

+0

가능한 복제본 http://stackoverflow.com/questions/9294926/how-does-apple-find-dates-times-and-addresses-in-ailail – mbatchkarov

답변

4

이것은 information extraction의 애플리케이션이며, 숨겨진 마르코프 모델 (HMM에) 랜덤 또는 조건부 필드 (CRFs) 등 시퀀스 세그멘테이션 알고리즘을 구체적으로 해결 될 수있다.

소프트웨어 구현의 경우 UMass-Amherst의 MALLET toolkit으로 시작할 수 있습니다. 정보 추출을 위해 CRF를 구현하는 인기있는 라이브러리입니다.

문장의 각 토큰을 단어 기능 (품사, 대문자, 소문자 등)의 기능으로 관심 분야 (예 : 위의 항목이없는 경우 'x' 사전 회원 자격 등) ... 이런 식으로 :

token  label  features 
----------------------------------- 
Let   x   POS=NNP, capitalized 
's   x   POS=POS 
meet  x   POS=VBP 
tomorrow DATE  POS=NN, inDateDictionary 
someplace x   POS=NN 
in   x   POS=IN 
Downtown LOCATION POS=NN, capitalized 
at   x   POS=IN 
7pm   TIME  POS=CD, matchesTimeRegex 
.   x   POS=. 

먼저 손으로 표시된 교육 데이터를 제공해야합니다. 나는 "-2"내 질문에 얻을 이유는 무엇

2

당신은 http://opennlp.apache.org 자바 툴킷

+0

감사합니다. 그러나 nlp를 열면 날짜/시간 항목을 지원하지 않습니다. 인식. –