2016-10-27 2 views
0

언어 모델링을 위해 HTK를 사용하는 방법에 혼란 스럽습니다. 나는 훈련 후How to do HTK를 사용하여 언어 모델링

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

Voxforge 사이트에서 튜토리얼 예제를 따라 테스트 나는 약 78 %의 정확도를 얻었다. 내 모국어로이 작업을 수행했습니다. 이제 언어 모델링에 HTK를 사용해야합니다.

동일한 작업을 수행하는 데 사용할 수있는 자습서가 있습니까? 도와주세요.

감사 speech_tri 내가 정확하게, 당신은 "N 그램 언어 모델"접근에 "문법"에서 변경하려고하는 질문을 이해한다면

답변

1

. 이 두 가지 방법은 인식기가 반환 할 응답에서 허용되는 단어의 조합을 지정하는 대체 방법입니다. Voxforge 과정을 따르면 아마 문법이 자리 잡을 것입니다.

언어 모델은 함께 나타나는 단어의 확률을 정의하는 텍스트 모음을 분석 한 것입니다. 사용 된 텍스트 코퍼스는 매우 전문화 될 수 있습니다. 코리 푸스를 읽고 모델을 생성하는 SRILM (http://www.speech.sri.com/projects/srilm/) 및 MITLM (https://github.com/mitlm/mitlm)과 같은 여러 가지 분석 도구가 있습니다.

모국어 단어를 사용하고 있으므로 분석 할 텍스트의 고유 한 자료가 필요합니다. 테스트 코퍼스를 얻는 한 가지 방법은 기존 문법에서 인위적으로 여러 문장을 생성하여이를 코퍼스로 사용하는 것입니다. 그런 다음 새로운 언어 모델을 사용하면 문법 대신에 인식기를 가리키고 최상의 결과를 얻을 수 있습니다.