2010-04-15 14 views
4

오디오 버퍼가 있고 음성 인식/녹음을하고 싶습니다. 나는 CPU와 RAM을 지역적으로 제한하여 서버에서 인식을 수행하려고합니다.음성 인식 (웹) 서비스?

내가 할 수있는 (웹) 서비스가 있습니까? 내 검색 지금까지 아무 주도하지 않은

...

+0

나는 그들의 프로그래머 문서가 존재하지 않습니다하지만이 좋은 발견입니다 ... 스핀 복스도 작성 –

답변

1

Lumenvox 같은 서비스를 제공하지만 사용자의 요구에 비싼 것 같다.

+0

을 발견했다. 처음에는 구입하고 나중에 이해하십시오. 또한 Spinvox Create는 문서를 사용할 수 있음을 발견했으나 사용자 정의 헤더, 다이제스트 인증, XML 및 64 인코딩 오디오가 포함 된 다중 게시물을 터무니없는 형식으로 쉽게 작성할 수있는 끔찍한 웹 API 뭉치입니다. 내 장치에서 ... –

2

Google은 방금 HTML5를 통해 음성 엔진에 대한 브라우저 기반 액세스를 도입했습니다.

$ chromium-browser --enable-speech-input 

나는 아이디어가 구글의 음성 인식기를 사용하는 응용 프로그램을 구축 할 수있을 것이라고 생각 : 우분투에서 다음과 같이

http://slides.html5rocks.com/#speech-input

이 페이지가 작동하도록하기 위해, 나는 크롬 브라우저를 출시 , 그러나 나는 그것에 깊이 들여다 볼 기회가 없었습니다.

또 다른 흥미로운 프로젝트는 MIT에서 와미입니다 : http://wami.csail.mit.edu

+2

Chromium이 OSS이므로 얼마간 시간을 들여서 실제로 네가 말하는 RESTful 서비스 엔드 포인트가 있음을 발견했다. 인식을 불러 일으키기 위해 별도의 라이브러리를 만드는 것이 너무 어려워서는 안됩니다 ... –

+0

Dave, 혹시이 문제에 대해 더 연구 했습니까? –

+0

Python/Ruby/등의 API를 구현하는 것이 매우 간단해야하지만 Chromium이하는 일을 수행하는 등의 작업을 수행해야합니다. 원하는 언어로 Speex 코덱 API를 찾을 수 있다고 가정하면됩니다. –