2013-10-30 5 views
0

cmusphinx를 사용하여 중국에서 14 세 미만 어린이를위한 어쿠스틱 모델을 만들고 어휘력을 약 800 단어로 만들고 싶습니다.어쿠스틱 모델을 학습하는 데 몇 시간이 필요합니까?

상업용 음성 엔진이 음향 모델을 훈련하는 데 수천 시간의 음성 녹음을합니다. (뉘앙스와 google은 2000+와 1000+ 시간을 보냈습니다.)

나는 대략 95 %의 정확한 비율을 달성해야하는데 음성 코퍼스에는 몇 시간이 필요합니까?

음성 코퍼스가 길수록 더 정확한 속도를 얻을 수 있습니까?

답변

0

300-400 시간은 좋은 양의 데이터입니다. 100 개 미만은 작동하지 않습니다.

데이터 크기가 늘어남에 따라 교육 데이터 자체에 체계적인 문제가있는 경우 정확도를 높이 지 않아도되지만 교육 데이터의 문제를 적절히 분석하면 결과가 향상 될 수 있습니다.

일반적으로 기계 학습을 배우는 경우 데이터 준비 문제를 다루게됩니다.

+0

빠른 답장을위한 Thx : 더 많은 사람들이 acoutic 모델에 필요한 사람이 있습니까? 어휘에 따라 컴퓨터에 시간을 훈련시키는 데 필요한 수식이 있습니까? 나는 여기에서 어떤 수를 참고했다 [link] (http://cmusphinx.sourceforge.net/wiki/tutorialam) [link] (http://www.speech.cs.cmu.edu/sphinxman/FAQ.html) – no7dw

+0

아니요 수식이 없습니다. –

관련 문제