0

Google 클라우드 음성 API에서 작업 중입니다. 내 flac 파일로 API를 시도했지만 그들은 내 flac 형식 파일의 일부를 복사하고 있습니다. 내 파일로 수행 할 수있는 작업이 없습니다. "GS : //kami1994/file-1506682082651.flac"{ "URI": 그것은 아주 끝내 요청 본문Google 클라우드 음성 전체 텍스트를 반환하지 않습니다

{ "오디오"에서 자신의 link .I 패스에 자신의 API를 테스트하려고 작동하게 } "구성"{ "인코딩": "FLAC" "은 languagecode": "EN-US" "sampleRateHertz"44100, "maxAlternatives"1} }

하지만 정확히 내가 말한 것처럼 텍스트를 반환하지 않습니다.

답변

0

음성 인식 엔진은 100 %가 아니라 매우 정확할 것으로 예상됩니다. 문제를 더 자세히 디버깅하려면 인식 설정에서 워드 시간 오프셋을 활성화 할 수 있습니다.

"config": { "encoding": "FLAC", "languageCode": "en-US", "sampleRateHertz": 44100, "maxAlternatives": 1, **"enable_word_time_offsets": True** } 

이렇게하면 단어 경계가 감지되는지 확인할 수 있습니다.

관련 문제