1

Google Glass 용 게임을 쓰고 있습니다. 유감스럽게도 Google Glass GDK의 현재 빌드에서는 SpeechRecognizer API를 사용할 수 없습니다.매우 간단한 음성/음성 인식 알고리즘

그래서 저는 매우 간단한 음성 인식 알고리즘을 구현하려고 생각해 왔습니다. "예"와 "아니오"만 인식하고 싶다고합시다.
구현에 도움이되는 예제 코드 또는 유용한 리소스를 알고 있습니까?
CMUSphinx와 같은 큰 프레임 워크를 사용하여 아이디어를 삭제해야합니까?

위, 아래, 오른쪽, 왼쪽 또는 1에서 10까지의 숫자는 어떻게 인식합니까?

+0

일반적으로 HMM (Hidden Markov Model)을 사용하여 음성 인식을 교육합니다. – Regenschein

답변

6

제가 알고 있듯이, 종종 주파수 도메인으로의 변환을 fast Fourier transform (FFT)으로 사용하여 분석합니다. 또한 주파수 상관 관계에 대한 사전 단어 사전이 필요합니다.

이 링크를 참조하시기 바랍니다 :

CMU Sphinx 자바 구현을 가지고있다.

David Wagner 좋은 기사 및 matlab 구현.

P. 오, 러시아어로 말하면 왜 this 문서를 읽지 않는지 - 아주 간단한 예와 함께.

P.P.S. 솔직히, 나는이 프레임 워크를 사용하지 않는다. 그러나 음성 인식에 대한 피상적 인 지식 만 갖고 있다면 강력하고 쉬운 방법은 프레임 워크 나 라이브러리와 같은 기존의 완벽한 솔루션을 사용하는 것이다. 그렇지 않으면 필요한 지식 임계 값을 확보하는 데 시간이 필요하다. 이 경우 this 문서를 읽을 수 있습니다.

+0

PocketSphinx (CMU 스핑크스의 일부)와 같이 보입니다. –