2013-02-12 2 views
2

비정형 데이터에서 날짜/시간 달력 이벤트를 구문 분석 할 수있는 Java 라이브러리를 누군가 제안 할 수 있습니까? 예일반 날짜 구문 분석 라이브러리

  • 오늘 밤 10시에 시작합니다! 일요일 2 월 10 일 => 10/2월/2013 오후 10시
  • 내일 (2 월 10 일) => 10/2월/2013
  • 일요일 2월 10 \ 연구 \ 2 월 16 일까지 매일 상영

등 nwith를

입력 데이터는 사용자가 제공하므로 임의의 형식으로 데이터를 입력 할 수 있습니다. 가능한 모든 토큰을 식별하고 모든 토큰에 대해 정규식 일치를 시작했습니다. 누군가 파서를 실제로 도울 수있는 Java 라이브러리를 제안 할 수 있는지 궁금합니다.

나는 다른 게시물을 통해 실행했지만 그들은 기술을 제안하는 것, 나는 누군가가 라이브러리를 가지고 있는지 궁금해.

감사

답변

0

당신은 http://opennlp.apache.org/에서 아파치 openLNP (자연 언어 처리)에서 트렁크 소스의 일부를 수행하거나 서버에 openNLP 구현하여 호출 RESTful 웹 서비스를 설정할 수 있습니다. OOB openNLP 구현의 이점은 날짜, 시간, 조직, 위치 및 사람들을위한 nameFinder 인터페이스를 통해 엔티티 추출기를 사용한다는 것입니다. 또한 적절한 엔티티 유형을 나타내는 관심 항목에 대한보다 일반적인 컨텍스트의 예제 파일을 작성하고 컨텍스트에 더 적합한 히트 비율을 얻기 위해 NLP 모델을 교육 할 수 있습니다. http://www.augmentedintel.com/apps/csharpnlp/extract-names-from-text.aspx에서 내 포트폴리오의 앱 섹션에 C# NLP의 작동 예제가 있습니다.

+0

감사합니다. Don for the response :). 다른 구문 분석 라이브러리 (이 라이브러리 제외)를 시도했지만 경험이별로 좋지 않았습니다. 그래서 나는 텍스트의 키워드에 기초하여 순위 알고리즘을 생각해 냈습니다. 그리고 수동 검토의 일부 라운드와 함께 알 고의 정확성이 개선되었습니다. 그러나 나는 당신이 제안한 방향으로 조사 할 것입니다. 감사 – jaipster

0

UTAH (https://github.com/sonalake/utah-parser)는 구조화되지 않은 텍스트의 일반적인 구문 분석을지도로 처리 할 수 ​​있습니다. 일단 그렇게하면 포맷터에 넣을 수 있습니다.