2013-07-06 3 views
1

내 프로젝트에 자연어 처리가 필요합니다. 나는 현장에서 완전히 새로운 사람이다.자연어 처리 단어 연결

내가 얻으려고하는 것은 사용자가 문자를 입력 할 때 합법적 인 단어를 만들기 위해 특정 문자를 따라갈 수있는 영문 문자 목록을 얻고 싶습니다.

이렇게하기위한 NLP의 특정 용어는 무엇입니까? 나는 잠시 동안 인터넷 검색을 시도했지만 그 용어를 모르기 때문에 운이 없었습니다. 좋은 자습서부터 시작하니? 이 특정 작업을 수행하는 데 훌륭한 라이브러리가 있습니까?

감사합니다.

답변

1

NLP 커뮤니티에 오신 것을 환영합니다.

찾고있는 용어는 아마도 query prediction 또는 sentence prediction 일 것입니다. 예를 들어 Google에 일부 문자를 입력하면 검색어를 검색 할 수있는 특정 단어/구문을 예측하기 시작합니다. 그리고이 기술 뒤에 그들은 언어 기반 휴리스틱과 (b) 사용자 기반 검색 기록을 사용하여 모델을 교육했습니다. 그들은 그것은 더 당신이 기술적으로는 전화 autocomplete (https://en.wikipedia.org/wiki/Autocomplete)의 빠른 입력하는 데 도움이되는 기능이 전화를 사용할 때처럼, 당신은 sentence/word prediction을 찾는 경우가 Google Instant, http://www.google.com/insidesearch/

를 참조 전화 https://en.wikipedia.org/wiki/Autocomplete를 참조하십시오. 현대의 autocomplete은 NLP를 사용하여 사용자가 입력 한 단어 다음에 나오는 구문 론적/의미 론적 단어를 예측합니다.

@evan에 따르면 markov chain은 학습 데이터의 패턴을 학습하는 방법으로 시스템을 테스트 할 때 구현 한 휴리스틱/통계 예측에 따라 단어를 추측 할 수 있습니다. https://en.wikipedia.org/wiki/Markov_chain

을 참조하십시오.
1

문자 빈도뿐만 아니라 언어 모델을 살펴보십시오. 마르코프 체인은 종종 이런 종류의 문제에도 사용됩니다.