1

저는 짧은 이야기 (1-2 분)를 말하고이를 텍스트로 쓸 수있는 응용 프로그램에서 작업하고 있습니다.서비스가 잠시 멈출 때까지 아무 것도 인식하지 못합니다.

나는 MediaCapture를 사용하여 청크 분할 전송 인코딩으로 녹음 된 음성을 스트리밍하고 Bing Speech API로 보냅니다. 한 가지 문제를 제외하면 모든 것이 효과적입니다. 사용자가 몇 초 동안 일시 중지하고 일시 중지가 인식 된 후 아무 말도하지 않으면 계속됩니다.

청크 분할 전송이이 문제의 원인이 아닌지 확인하기 위해 녹음 된 wav 파일을 사용해 보았습니다. 그러나 그것은 동일한 행동을 일으켰습니다. 따라서 전송이 정확하고 올바른 응답을 얻을 수 있지만 레코드의 첫 번째 부분에 대해서만 유효합니다.

누군가 동일한 문제가 발생 했습니까? 디자인에 의한 것입니까? 그렇다면이 문제를 해결할 수있는 방법이 있습니까?

답변

0

SDK을 사용할 수 있습니다. 받아쓰기와 같은 긴 형식 시나리오에 더 적합합니다. 나머지 API에서는 연결이 닫히기 전에 잠깐 기다려야하지만 SDK에서는 더 오래 기다릴 수 있습니다.

관련 문제