I 음성 인식 및 음성 녹음을 위해 잘 작동하는 솔루션을 가지고의 범위를 벗어 . 솔루션의 작동 상태를 보여주기 위해 만든 간단한 Android 프로젝트에 link이 있습니다. 또한, 응용 프로그램을 설명하기 위해 프로젝트 내부에 인쇄 화면을 몇 개 넣었습니다.
내가 사용한 접근 방식을 간략하게 설명하려고합니다. 나는이 프로젝트에서 구글 스피치 API와 Flac 녹음이라는 두 가지 기능을 결합했다.
Google 음성 API는 HTTP 연결을 통해 호출됩니다. Mike Pultz은 API에 대한 자세한 내용을 제공합니다 :
"(...) 새로운 [Google] API는 전이중 스트리밍 API입니다. 즉, 실제로 두 개의 HTTP 연결 - 업로드를위한 하나의 POST 요청을 사용한다는 것입니다 콘텐츠를 "라이브"청크 스트림으로, 두 번째 GET 요청을 통해 결과에 액세스 할 수 있으므로 긴 오디오 샘플이나 스트리밍 오디오에 훨씬 더 적합합니다. "
그러나이 API는 제대로 작동하려면 FLAC 사운드 파일을 받아야합니다. Flac 녹음
나는 AudioBoo라는 오픈 소스 응용 프로그램에서 코드와 라이브러리의 일부를 추출하고 적용하여 해당 프로젝트에서 Flac 녹음을 구현했습니다. AudioBoo는 원시 코드를 사용하여 flac 형식을 기록하고 재생합니다.
따라서 flac 사운드를 녹음하고 Google Speech API로 보내고 텍스트를 가져 와서 방금 녹음 된 사운드를 재생할 수 있습니다.
내가 만든 프로젝트에는 작업을 수행하는 기본 원칙이 있으며 특정 상황에서 향상시킬 수 있습니다. 다른 시나리오에서 작동하게하려면 Google Chromium-dev 그룹에 속한 Google 음성 API 키를 가져와야합니다. 그 프로젝트에 하나의 키만 남겨 두었다가 작동하고 있음을 보여 주지만 결국은 제거 할 것입니다. 누군가가 그것에 대해 더 많은 정보를 필요로한다면, 나는이 게시물에 2 개 이상의 링크를 넣을 수 없기 때문에 알려 주시기 바랍니다.
이것이 API에 포함 된 적이 있다면 알고 계십니까? 자신의 녹음을 Google에 보내는 것에 대한 해결책을 찾지 못하셨습니까? – ahsteele
나는 똑같은 것을 궁금해하고있다. 나는 안드로이드가이 고수준이라고 믿을 수 없다. 진지하게 언론에 있어서는 API가 부족한 것 같다. – Tom
Android가 제공되지 않음이를 수행 할 수있는 모든 라이브러리. – sravan