자동차 환경에서 음성 분리로 음성 인식 정확도를 높이고 싶습니다. 소음, 라디오 음악 및 다른 화자의 음성이 항상 혼합 될 수 있기 때문에 다루어야 할 음성은 문제입니다.FASST를 사용한 음성 분리
음성을 두 부분으로 나누고 싶습니다. 하나는 내 목소리이고, 다른 하나는 정의 된 일반적인 잡음입니다. 이를 위해 HTK에서 스피커 별 GMM 모듈 (내 목소리)을 학습 한 다음 FASST를 사용하여 음성을 분리합니다. 이게 효과가 있다고 생각하니?