2012-12-12 6 views
3

처음에는 모국어 지원을 위해 처음부터 음성 인식 엔진을 작성 (50-100 단어 지원) 할 생각이었습니다.로컬 언어를 지원하기 위해 스핑크스 확장하기

그러나 약간의 연구 끝에 1.5 년 안에 매우 제한된 지원을하더라도 음성 인식 엔진을 만들 수 없다는 것이 명백 해졌다.

이제 스핑크스 엔진을 확장하여 내 언어를 지원할 생각을하고있었습니다. 1.5 년 내에 할 수 있느냐 혹은 최종 프로젝트를 위해 너무 많은 일이있다.

본인은이 문제에 관해서 귀하의 경험을 기다리고 있습니다.

+0

링크를 보려면 http://stackoverflow.com/a/8215967/432021 –

+0

@NikolayShmyrev thks를 읽으십시오. 그러나 여전히 의문이 남아 있습니다. 멍청한 프로그래머가 1 년 내에이 작업을 수행 할 수 있습니까? –

+0

당신은 한 달에 그것을 달성 할 수있을 것입니다 –

답변

2

음성 인식 시간은 응용 프로그램에 따라 다릅니다.

당신이 필요합니다 :

  1. 당신이 인식 할 단어가 무엇인지 정의;
  2. 이 단어에 대한 음성 사전을 작성하십시오.
  3. 여러 명의 원어민이 녹음 된 단어입니다.
  4. 녹음 된 데이터의 유효성을 검사합니다.
  5. 음향 모델을 훈련하기위한 데이터 준비;
  6. 문법 또는 언어 모델을 생성합니다 (이 경우 음성 학적으로 균형 잡힌 단어/문장을 녹음해야합니다).
  7. 열차 음향 모델;
  8. 시스템을 테스트하십시오.
  9. 문법 및 음향 모델 (화자 적응)을 조정하고 조정합니다.
  10. 위의 9 가지 주제를 모두 만드는 방법을 알아보십시오. :)

항목 10은 가장 많은 시간을 소모하는 작업입니다.

답변 : 예, 상업용으로 3 개월 이내에 제작할 수 있습니다.

스핑크스는 하나의 가능성이 있습니다. HTK는 완벽한 시스템을 교육하고 테스트하기위한 훌륭한 오픈 소스 음성 인식 시스템입니다. 줄리어스는 HTK로 제작 된 어쿠스틱 및 언어 모델을 사용하는 오픈 소스 음성 인식기 (엔진)입니다.

루이스 Uebel

ASR 연구소 - www.asrlabs.com.br

+0

답변 감사합니다. 너는 sphnix 엔진이 3 달 안에 현지 언어를 위해 확장 될 수 있는다 것을 너는 말했다. 여기에 또 다른 질문이 있는데, 관련된 일의 양이 최종 년도 프로젝트를 정당화하기에 충분할 것입니까? –

2

네, 확실히 가능하다. 내 수석 논문에 대한 Chatino에 대한 비슷한 인식자를 만들었습니다. (Chatino는 남부 멕시코의 Oaxaca 출신 언어입니다.) 인식기에는 격리 된 단어 인식기와 Sphinx4를 사용하여 만든 연속 음성 인식기가 모두 포함되어 있습니다.

자세한 내용은 http://www.jaimalayalam.com/papers/chatinoVoiceRecognition09.pdf을 참조하십시오.

+0

링크를 가져 주셔서 감사합니다. 어떤 함정, 추천? 최종 학년도 프로젝트에 기술적으로 적합한가? –

+0

내 고학년 프로젝트 였기 때문에 확실히 가능합니다. 좋은 성적표를 작성해야하며, 짧은 부분 (기록부 한 줄당 녹음)에 세심한 녹음을하고, 언어에 대한 음성 사전 또는 분해기를 준비해야합니다. 아마도 일단 프로젝트에 참여하게되면 더 구체적인 질문을 할 수 있습니다. – vjaivox

관련 문제