2016-09-26 2 views
5

저는 Chromium Google Speech API를 사용하여 최근에 Google Cloud Speech API를 사용하도록 전환했습니다. 구글 클라우드 스피치 API가 발표 된 이래로, 퍼포먼스는 인식의 정확성 측면에서 저하 된 것으로 보인다. 또한 오디오 스트리밍을 위해 점점 더 많은 "빈 결과"가 나오고 있습니다.Google 클라우드 음성 API가 빈 결과를 반환합니다.

여러 오디오 서비스로 동시에 오디오를 스트리밍하고 일부 서비스가 텍스트를 복사하는 동안 Google Cloud Speech API가 빈 결과를 반환합니다. Chromium Speech API 및 Google Cloud Speech API의 작동 방식이 변경된 경우 궁금합니다.

적절한 헤더에 대해 오디오의 유효성을 검사하고 Google에 오디오를 스트리밍하고 있음을 확인했습니다.

가끔씩 (대다수와 마찬가지로) Google에서 빈 결과를 반환하는 사람이 있습니까?

+0

http://stackoverflow.com/questions/38906527/google-speech-recognition-api-result-is-empty 관련 –

답변

4

정확한 유형의 오류를 재현하려면 세부 정보가 필요하므로이 문제 유형은 공개 이슈 트래커에 더 적합합니다. 이 form을 필수 정보로 채우거나 적어도 코드를 명확하게 보여주는 최소한의 작업 예제로 작성하십시오. 정확한 재생산을 위해 실행 한 샘플 코드 나 명령을 제공하는 것이 중요합니다.이 코드는 스트리밍 한 오디오 파일의 구성 파일과 URI (또는 파일)와 함께 오류를 반환하고 빈 결과를 반환합니다.

사실상 현재 Beta에있는 음성 API와 관련하여 알려진 문제가 있으므로 제대로 작동하지 않을 수 있습니다. 그 동안에 최선의 사례가 귀하의 사례에 적용되는지 확인하려면 다음 documentation을 참조하십시오.

1

나는 또한 빈 응답을 받았지만 결국 다른 설정으로 인코딩하여 결과를 얻었습니다.

sox async.wav -t raw --channels=1 --bits=16 --rate=16000 --encoding=signed-integer --endian=little async.raw

1

는 또한 구글 음성 API가 빈 결과를 반환 같은 문제가 있습니다. 오디오 파일을 LINEAR16으로 변환하려면 FFmpgeg을 사용했습니다. 내가이 명령을 사용 LINEAR16 내 오디오 파일을 변환

brew install ffmpeg 

:

ffmpeg -i input.flac -f s16le -acodec pcm_s16le output.raw 

을 그리고 난 내 Google stogage에로드 된 후 : 여기 https://console.cloud.google.com/storage/browser/

설치의 경우이 도구는 내가 브루 사용 요청을 만들기위한 구성을 가진 JSON 파일입니다 :

{ 
    'config': { 
     'encoding':'LINEAR16', 
     'sampleRate': 16000, 
     'languageCode': 'en-US' 
    }, 
    'audio': { 
     'uri':'gs://your-bucket-name/output.raw' 
    } 
} 

f 비동기 인식 방법을 사용해야하는 1 분 이상 :

curl -s -k -H "Content-Type: application/json" \ 
-H "Authorization: Bearer [YOUR-KEY]" \ 
https://speech.googleapis.com/v1beta1/speech:asyncrecognize \ 
-d @sync-request.json 

작업 ID가 반환됩니다. 작업 결과를 가져와 준비가되었는지 확인할 수 있습니다.

curl -s -k -H "Content-Type: application/json" \ 
-H "Authorization: Bearer " [YOUR-KEY]\ 
https://speech.googleapis.com/v1beta1/operations/[OPERATION-ID] 
관련 문제