twilio가 speech2text 처리에서 중요한 지연을 수집합니다.

사용자의 입력을 수집하는 데 TwilioML을 사용하고 있습니다.twilio가 speech2text 처리에서 중요한 지연을 수집합니다.

내가보기에 중요한 지연은 4-6 초입니다. 사용자가 말하기를 중지 한 시간부터 내 서비스 (끝점)가 호출 될 때까지의 시간입니다. 이것은 매우 간단한 문장 (예 : 내 이름은 존입니다)에서도 일어납니다.

이 것이 알려진 문제입니까? 사용자 경험 관점에서 보면 큰 경험이 아닙니다.

필자는 '필러'를 추가하려고했지만 이전에 끝점을 호출 할 때 시작할 수 있기 때문에 효과가 없습니다. 오디오가 텍스트로 변환되는 동안 파일을 동시에 재생하는 방법이있을 수 있습니다. documentation에서

2017-11-30 Clca

'타임 아웃'속성은 Twilio가 에 이동과에 요청을 전에 다른 단어를 다른 숫자를 누르거나 말을 호출자 기다리는 시간 (초)에 제한을 설정 '액션'URL 예를 들어 'timeout'이 '3'이면 Twilio는 발신자가 키를 누르거나 다른 단어를 말하기 전에 3 초 동안 기다렸다가 이전에 자리의 'action'URL에 숫자 또는 음성을 입력합니다. Twilio는 시간 초과 기간을 시작하기 전에 이 모든 중첩 된 동사의 실행을 완료 할 때까지 기다립니다.

지연 시간이 4 ~ 6 초로 표시되는 사실은 기본 시간 제한 설정이 5 초이므로 실제로 설명됩니다.

partialResultCallback URL을 사용해 보셨습니까? Twilio가 음성 인식 결과를이 URL에 실시간으로 제출하면 설정됩니다. 발신자가 특정 단어를 말하면 인식 속도를 높일 수 있기를 기대한다면 힌트를 추가 할 가치가 있습니다.

출처

2017-12-01 02:57:21 miknik

이 의미가 있습니다. 호출 시간 초과를 설정했는데, 너무 높아서 사용자 경험이 향상되는지 확인하기 위해 더 작은 시간 제한으로 일부 테스트를 실행합니다. 감사! – Clca

내가 나중에 생각한 몇 가지 제안으로 내 대답을 업데이트했습니다 – miknik

또한 실제로 ['speechTimeout']을 설정할 수 있습니다 (https://www.twilio.com/docs/api/twiml/gather#attributes- speechTimeout)을 사용하여 ''및 음성 입력과 함께 사용합니다. 사용자가 일단 말을 멈 추면 액션을 호출하기 위해 'auto'로 설정해보십시오. 자세한 내용은 설명서를 확인하십시오. – philnash

twilio가 speech2text 처리에서 중요한 지연을 수집합니다.

답변

관련 문제