2014-06-09 3 views
-1

wav 파일과 같은 오디오 파일에 사용 된 음성 언어를 감지하기위한 오픈 소스 라이브러리를 찾고 있습니다.오디오 언어 식별

CMU 스핑크스를 사용해 보았지만 언어 감지에 사용하는 방법을 이해할 수 없었습니다. 누군가 도와 주실 수 있습니까?

답변

1

모든 전화 디코드 모드에서 CMU 스핑크스를 사용해 볼 수 있습니다. 식별하려는 언어에 대한 모델을 교육하십시오. 가설 점수가 가장 좋은 언어를 선택하십시오.

2

다른 툴킷을 배우고 싶다면, Kaldi []를 고려해야합니다. 그것은 트렁크에서 언어 인식 시스템과 유사한 모델을 사용하는 스피커 인식 시스템과 샌드 박스 language_id의 실험 언어 식별 설정을 갖춘 오픈 소스 음성 인식 툴킷입니다. 저장소를 체크 아웃 한 후 svn switch ^/sandbox/language_id를 사용하여 LID 샌드 박스로 전환 할 수 있습니다. LID 예제는 egs/lre07에 있습니다.

어떤 도구 키트를 사용하든 나는 음향 시스템 대신 i- 벡터 기반 시스템을 사용하는 것이 좋습니다. i-Vector 기반 시스템은 사본을 필요로하지 않으므로 설치가 더 쉽고 해독을 피하기 때문에 훨씬 빠릅니다.