-1
내 작은 POC 들어, 내가 선호하는 자바에서 자연 언어 처리를 사용할 수있는 모든 오픈 소스 라이브러리를 찾고 있는데요. 기본적으로 나는 인간 언어로 사용자로부터 입력을 받아 제공된 문서 나 웹을 통해 필터링하여 결과를 반환하는 응용 프로그램을 가질 계획입니다. 모든 리드가 인정 될 것입니다.자바에서 자연 언어 처리 라이브러리
내 작은 POC 들어, 내가 선호하는 자바에서 자연 언어 처리를 사용할 수있는 모든 오픈 소스 라이브러리를 찾고 있는데요. 기본적으로 나는 인간 언어로 사용자로부터 입력을 받아 제공된 문서 나 웹을 통해 필터링하여 결과를 반환하는 응용 프로그램을 가질 계획입니다. 모든 리드가 인정 될 것입니다.자바에서 자연 언어 처리 라이브러리
"인간 언어의 사용자 입력"은 텍스트 형식으로되어 있습니까? true이면 텍스트 데이터 검색자를 찾고 있습니다. Apache Lucene은 방대한 문서, 예제, 기능이 내장되어 있고, 사용하기 쉽고 훌륭한 공동 작업을하는 데 실제로 유용합니다.
형태소 분석과 불용어와 같은 인간의 자연어에서 물려받은 많은 과제는 실제로 사용하기 쉽고 API가 유용합니다. 예 :
TokenStream tokenStream = new StandardTokenizer(
Version.LUCENE_36, new StringReader(input));
tokenStream = new StopFilter(Version.LUCENE_36, tokenStream, stopWordsSet);
tokenStream = new PorterStemFilter(tokenStream);
행운을 비네!
감사합니다. github 또는 데이터를 쿼리하기 위해 텍스트에서 자연어를 사용하는 어딘가 다른 예를 언급 할 수 있습니까? –
물론. 몇 가지 검색어 예를 제공 할 수 있습니까? – Doleron
예 간단한 쿼리는 "Oracle Webcenter에 등록 된 TCP 포트는 무엇입니까?"와 같은 사용자의 쿼리 일 것입니다. 이 질문에 대답하려면 웹 센터의 릴리스 문서 또는 웹 검색을 수행해야합니다. –