사용자의 입력을 수집하는 데 TwilioML을 사용하고 있습니다.twilio가 speech2text 처리에서 중요한 지연을 수집합니다.
내가보기에 중요한 지연은 4-6 초입니다. 사용자가 말하기를 중지 한 시간부터 내 서비스 (끝점)가 호출 될 때까지의 시간입니다. 이것은 매우 간단한 문장 (예 : 내 이름은 존입니다)에서도 일어납니다.
이 것이 알려진 문제입니까? 사용자 경험 관점에서 보면 큰 경험이 아닙니다.
필자는 '필러'를 추가하려고했지만 이전에 끝점을 호출 할 때 시작할 수 있기 때문에 효과가 없습니다. 오디오가 텍스트로 변환되는 동안 파일을 동시에 재생하는 방법이있을 수 있습니다. documentation에서
이 의미가 있습니다. 호출 시간 초과를 설정했는데, 너무 높아서 사용자 경험이 향상되는지 확인하기 위해 더 작은 시간 제한으로 일부 테스트를 실행합니다. 감사! – Clca
내가 나중에 생각한 몇 가지 제안으로 내 대답을 업데이트했습니다 – miknik
또한 실제로 ['speechTimeout']을 설정할 수 있습니다 (https://www.twilio.com/docs/api/twiml/gather#attributes- speechTimeout)을 사용하여 ''및 음성 입력과 함께 사용합니다. 사용자가 일단 말을 멈 추면 액션을 호출하기 위해 'auto'로 설정해보십시오. 자세한 내용은 설명서를 확인하십시오. –
philnash