0

별도의 단어 음성 인식에 Hmm을 사용하고 있습니다. 내 데이터베이스에 대한 내 Hmm을 교육했습니다. 들어오는 오디오 신호에 대한 확률을 계산하고 비교합니다. 내가 가지고있는 문제는 서로 다른 단어가 다른 수의 검색 경로 (검색 경로 = 상태 = 관찰 수)를 제공하는 최적 상태의 수가 다르므로 확률을 비교할 수 없습니다. 다른 주 수의 효과를 어떻게 정상화합니까?HMM을 사용한 음성 인식

답변

4

단어 하나가 아닌 발음을 인식하려면 문맥 자유 문법이나 언어 모델 (일반적으로 - 3-gram 확률 모델)이 필요합니다. 그런 다음 적절한 알고리즘을 사용하여 각 경로의 점수를 계산합니다. Kaldi 또는 CMUSphinx과 같은 기존 솔루션을 살펴 보는 것이 좋습니다.