2010-08-11 5 views
0

저는 음성 인식 시스템을 만들고 있습니다. 줄리어스는이 작업에서 나쁜 결과를 보여주지 않습니다. 샘플 .voca 파일의 단어가 완벽하게 인식되지만 자신의 단어와 문자를 파일에 배치하는 방법은 무엇입니까?Julius의 음성 인식. .voca 파일을 만드는 방법?

내가 VoxForge (http://www.voxforge.org/) 마지막 릴리스를 시도하고 야간 어휘와 음향 모델 구축하지만 줄리어스에서 많은 오류는 다음과 같이 시작 많아요했습니다

Error: voca_load_htkdict: line 19: triphone "r-d+v" not found 
Error: voca_load_htkdict: line 19: triphone "d-v+aa" not found 
Error: voca_load_htkdict: the line content was: 2 [AARDVARK] aa r d v aa r k 
Error: voca_load_htkdict: begin missing phones 
Error: voca_load_htkdict: r-d+v 
Error: voca_load_htkdict: d-v+aa 
Error: voca_load_htkdict: end missing phones 
Error: init_voca: error in reading /usr/src/custom/julius/quickstart/grammar/sample.dict 
ERROR: failed to read dictionary "/usr/src/custom/julius/quickstart/grammar/sample.dict" 
ERROR: m_fusion: some error occured in reading grammars 
ERROR: Error in loading model 

사람은 규칙을 알고있다 .voca 파일에 대한 단어 기록.

답변

2

오류 이유 : "voca_load_htkdict.c"가 어쿠스틱 모델의 triphone 목록과 dict 파일의 triphone을 일치 시키려고하므로 단어 사전에 어쿠스틱 모델에 포함되지 않은 단어가 포함되어있을 때 julius가이 메시지를 optput합니다. 찾지 못하면이 오류를 표시하고 프로그램을 중지합니다.

가능한 오류 솔루션 : 1. enable -forcedict 옵션을 사용하거나 jconf 파일의 주석 처리를 제거하여 사전의 오류 단어를 무시하고 강제 실행합니다. 또는 2. "찾을 수없는 트라이 폰"을 hmmlist 파일 "묶음 목록"의 가장 가까운 실제 트라이 폰에 매핑하십시오. 예 : b-ey + tv-eh + t 첫 번째 열은 사전에서 생성 된 triphone의 이름이고 두 번째 열은 실제로 오전에 정의 된 HMM의 이름입니다.

"찾을 수없는 트라이 폰"이 적거나 많지 않은 경우이 솔루션을 수행 할 수 있습니다.

  1. 가장 좋은 방법은 생산 COMERCIAL 프로젝트는 음향 모델을 학습해야합니다 때문 처음 두 솔루션은 테스트 줄리어스에 대한한다는 AM 노트에없는 DICT 파일에있는 단어를 포함하지 않는 것입니다 동일한 코퍼스를 가진 언어 모델.