2012-03-05 20 views
3

나는 누군가의 목소리를 녹음하고 나서 정보에서 나는 그/그녀의 목소리에 대해 알게된다. 문제는 어떤 통계 (주파수와 같은)가 사람의 목소리에 어떤 차이가 있는지에 대한 정보가 없다는 것입니다.사람 음성 인식/인식

나는 음성 인식에 대한 다양한 라이브러리를 발견했지만 내 문제는 매우 간단하기 때문에 도움이되지 못했습니다. 나는 단지 그가 말하는 것을 말하지 않는 사람을 인식하고 싶다.

+2

무엇이 더 간단할까요? –

+1

음 ...! 그냥 내 생각! 어쩌면 더 힘들 수 있습니다! – Ocelot

+2

이 문제는 여러 가지 단어로 한정됩니다 ... 그러나 "단순"은 그 중 하나가 아닙니다. – ereOn

답변

3

같은 사람의 목소리가 다른 경우 (예 : 사람이 감기 등) 소리가 나거나 사람이 크게/빠르게/느리게 말하는 등의 이유로 간단하지 않습니다.

또 다른 포인트는 다른 사운드 (배경, 다른 목소리 등)와의 분리입니다.

소리를 기록하는 장비의 품질은 매우 중요합니다 - 일부 시스템은 좋은 결과를 달성하기 위해 여러 개의 마이크를 사용 ...

은 전부이 쉬운 일이 아니다 - ESP. 좋은 탐지 비율을 원한다면

기본적이를 구현하는 방법은 다음과

  • 음성의 지문 (S)와 DB를 생성 구현 강력한 사운드/음성 패턴을 추출
  • 을 강력한 사운드 분리
  • 구현은 이상적인 사운드 설정에 따라 인식하고 싶습니다.
  • 저장된 지문과 추출/정규화 된 사운드/음성 패턴을 비교하기위한 알고리즘을 정의하십시오 ("아마도 같음"등에 대한 몇 가지 임계 값이 필요할 수 있습니다 ...).)
  • 0 당신이 허용 검출 율을 달성 할 때까지
  • 당신의 알고리즘을 수정 (너무 계정에 위양성률을!)

을 멋진 개요 Linux 용 http://www.scholarpedia.org/article/Speaker_recognition

3

참조 VoiceID를 참조하십시오. 그것은 스핑크스와 다른 libs를 사용하고 아주 쉽게 설치됩니다.

관련 문제