2014-02-27 4 views
-1

C# .Net을 사용하여 음성 인식 응용 프로그램 (오디오 - 텍스트 변환)을 개발 중입니다.타사 음성 인식 SDK 또는 라이브러리를 나열하십시오.

나는 Microsoft SAPI 5.1의 정확성을 떨어 뜨렸다.

이제 제 요구 사항을 충족시키는 다른 제 3 자 소프트웨어를 원합니다.

Nuance Dragon Naturally Speaking SDK는 마켓에서 사용할 수 있지만 응용 프로그램과 통합하고 싶기 때문에 최소 2 일 동안 평가판을 제공하지 않았습니다.

이미이 시나리오에 대한 경험이있는 사람들을 제공하십시오.

+0

전화 연설을 할 때 많은 선택의 여지가 없습니다. [CMUSphinx] (http://cmusphinx.sourceforge.net) –

+0

귀하의 요구 사항은 무엇입니까? –

+0

C# .net을 사용하여 오디오 (녹음 된 오디오 파일)를 텍스트 형식으로 변환하고 싶습니다. 그래서 100 % 정확도를 제공하는 제 3 자 음성 인식 엔진이 있습니다. – user1649155

답변

0

귀하의 요구 사항은 아직 명확하지 않지만 표면적으로 100 % 정확성에 대한 요청은 도달 할 수없는 것 같습니다. 오디오를 텍스트로 변환하여 오디오가 대화 유형이라고 가정하면, SLM (Statistical Language Model) 기반 솔루션을 살펴볼 수 있습니다. SLM에 대한 100 % 정확도는 거의 없습니다. 오디오가 잘 알려지지 않은 제한된 도메인의 오디오 인 경우 100 %에 가까울 수 있습니다.

귀하의 질문에보다 구체적으로 답변을 드릴 수 있도록 자세한 내용을 제공하는 것이 좋습니다. 유용 할 정보

  1. 오디오의 주제는 무엇입니까? 구체적으로 말하면 자유 연설을 구사하려고합니까 아니면 좀 더 제약이 있습니까?
  2. 단일 또는 다중 스피커?
  3. 언어?
  4. 오디오 품질?

음성 인식 회사 목록을 제안하는 것이 매우 간단하지만 모든 회사가 동일한 응용 프로그램을 다루는 것은 아니기 때문에 이것은 거의 쓸모가 없습니다.

+0

오디오의 주제 문제 : IVR과의 대화 (IVR 대화를 인식해야하는 오디오와 단단히 결합하고 싶지 않으므로 언론의 자유와 같을 수 있음) 단일 또는 다중 스피커 : 다중 스피커 언어 : 영어 오디오 품질 : 최소 품질은 8000KHz, 16 비트/8 비트, 모노/스테레오 최대입니다. – user1649155