2011-09-22 7 views

답변

9

음성 인식을위한 상용 IOS 라이브러리의 무리가 있습니다. 계속 듣고있는 이름은 Nuance, iSpeech 및 Yapme입니다. 각각은 클라우드 음성 인식 (장치에서 제외)과 클라이언트 라이브러리 및 SDK를 제공하여 앱을 구축합니다. 당신이 미국과 영국 영어, 포함에 대한 귀하의 응용 프로그램을 음성 수 유럽, 스페인의 프랑스의 유럽, 독일어, 이탈리아어, 일본어 ---와 수 ... http://blog.dragonmobileapps.com/2011/01/mobile-app-developer-dragon-mobile-sdk.html

을 -

뉘앙스 스페인어 지원하는 것 2011 년 더 많은 언어로 탭하세요! http://www.masshightech.com/stories/2011/09/26/daily13-Nuance-tweaks-mobile-dev-program-with-free-access-to-Dragon.html

iSpeech 스페인어를 지원하는 것입니다 - -

와 지금 뉘앙스는 개발자들에게 무료로 액세스 할 수 있습니다 http://www.ispeech.org/developers/iphone

iSpeech의 모바일 SDK를 27 개 TTS 및 ASR (정의 된 문법) 언어와 15 개 언어를 지원 자유형 음성 받아쓰기 음성 인식.

Yapme, 죄송합니다, 잘 모르겠어요 - http://yapinc.com/speech-cloud.html

4

여기를 살펴 보자 http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

그것은를 검색 할 크롬 브라우저 음성의를 ...... 당신이 그것을 할 수 Objective-C에서. 크롬 브라우저에서 google.com으로 이동하여 스페인어가 인식되면 이깁니다. :)

쉽게 사용할 수 있습니다

- (void) SpeechFromGooglezzz { 
    NSURL *url = [NSURL URLWithString:@"https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=en-US"]; 

    ASIFormDataRequest *request = [ASIFormDataRequest requestWithURL:url]; 
    NSString *filePath = [NSString stringWithFormat:@"%@%@", [[NSBundle mainBundle] resourcePath], @"tmpAudio.flac"]; 

    NSData *myData = [NSData dataWithContentsOfFile:filePath]; 
    [request addPostValue:myData forKey:@"Content"]; 
    [request addPostValue:@"audio/x-flac; rate=16000" forKey:@"Content-Type"]; 
    [request startSynchronous]; 

    NSLog(@"req: %@", [request responseString]); 
} 

을 당신이 16000 비트 레이트 FLAC 파일을 기록해야한다는 것을 기억하십시오! 혹은 아무것도 아닌!

Google은 단어가 포함 된 json으로 응답합니다.

희망이 도움이됩니다.

+0

제 생각에 Google은 Chrome 및 Android 클라이언트를 제외한 상업적 용도로 이러한 서비스를 제공하지 않습니다. 나는 IOS의 API를 사용하여 상용 애플리케이션을 개발하지 않을 것이다. Google에서 애플리케이션을 쉽게 종료 할 수 있습니다. 프로토 타입이나 실험 일 뿐인 경우 Google 서비스 사용을 중단 할 수도 있지만 상업적 목적으로는 사용하지 않을 것입니다. –

+0

오른쪽이지만 앱이 상업용인지 아닌지는 Fernando가 지정하지 않았습니다! :) – elp

+0

사실 좋은 링크는 http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/입니다. –

1

Google Speech API 용 클라이언트 라이브러리를 작성했습니다. 아이폰 OS에서 가장 잘 작동하고 또한 다른 유닉스 계열 시스템을 지원합니다

편집 : 여기에 시도 : https://github.com/H2CO3/libsprec