2014-01-23 2 views
1

내 음성 엔진에서 여러 문법을 활성화/비활성화합니다.Microsoft 음성 인식 : 와일드 카드 빈 콘텐츠

특별한 단계에서 저는 엔진 특성에 따라 다음 주어진 문장의 오디오를 캡처하기 위해서만 문법을 실행하고 싶습니다.

하지만 뭔가 일치하는 것을 시작/중지하려면 엔진에 "단어"가 필요하다고 가정합니다. 그래서 어떻게 해야할지 모르겠다.

(기저의 설명 : 내 응용 프로그램은 받아쓰기가 너무 나쁜 넥트에 아무런 사용할 수 있기 때문에 구글 음성 API를 사용하여 텍스트로 모든 쓰레기 오디오 변환)

답변

0

음, 사실, 아니, SR 엔진은 것을 알 필요가 들어오는 오디오는 "스피치와 비슷합니다"(대개 오디오의 스펙트럼 특성으로 결정됨)입니다. 특히 AudioPosition 속성과 SpeechDetectedRecognitionRejected 이벤트를 사용하여 거부 된 모든 오디오를 Google 음성 API에 보낼 수 있습니다.

그래서 워크 플로우는 다음과 같이 보일 것이다 :

  1. 사용자의 질문.
  2. 적절한 문법을 ​​사용하십시오.
  3. 인식 또는 인식이 거부 될 때까지 기다립니다.
  4. 인식 과정, 이에 따라 처리
  5. 인식이 거부 된 경우 보존 된 오디오 &을 Google 음성 API로 전송합니다.
+0

잘 알았다면 다음은 내 워크 플로입니다. 1. 사용자에게 질문합니다. 2. 주어진 Gramamr을 활성화합니다. 3. "와일드 카드 응답"이 필요합니다. 4. 응답을 처리합니다. 그래서 나는 2./3을하지 않습니다. 그리고 나는 문법을 유발하지 않을 것이기 때문에 "speech detected"로 연주한다. –

+0

좀 더 명확한 답변이 업데이트되었다. (주석으로 목록을 작성하는 것은 어렵습니다.) –

+0

예 정확히 작동합니다. –