0

그래서 자동 음성 인식 시스템을 구축 중이며 베이 즈 정리을 분류 자로 사용하고 싶습니다. 나는 아직도 그것에 대해 읽었으며 개념을 이해하려고 노력하고 있으므로 가능한 가장 간단한 방법으로 나를 대답하도록 노력하십시오.Naive Bayes 분류 자 ​​

MFCC 내 음성에서 기능을 추출하고 단어의 기능으로 행을 포함하는 배열 인 내 Class_template을 만들었습니다. 열은 각 단어를 나타냅니다 (열 개 단어 만 사용하므로 10 열은 10 단어입니다). 이제 필자는 필자의 필자의 배열을 가지고 새로운 테스트 단어를 입력했다. 그것에 대한 작업을 수행하고 그것을 특성 벡터로 변환하면 모든 것이 잘됩니다.

class_template에서 어떤 클래스 (단어)를 결정하기 위해 베이 즈 정리를 사용하고 싶습니다. 내 새 테스트 단어가 속합니다.

그래서 각 단어 (내 테스트 단어와 클래스 모두)의 평균과 표준 편차를 계산하고이 값들을 PDF (probing density function)에 꽂아야한다고 생각합니다. 내 class_template에있는 각 단어에 대한 내 테스트 단어의 확률을 계산할 때 사용합니다. 내 생각에 옳은 대답이다.

1-so 내가 뭘 잘못하고 올바른 방향으로 가고 있습니까 ???

2 - 팁, 포인터 또는 무엇을해야합니까 ???

3 - 평균값과 표준값을 연결해야하는 PDF를 계산할 때 클래스 또는 테스트 단어?

감사합니다.

답변

0

지금까지 설명한 내용이 대부분 옳았지만 패턴 클래스의 사전 확률은 어땠습니까? 균일 분포라고 가정하면 MLE와 동일하며 작은 샘플에 비해 성능이 떨어집니다.

+0

죄송합니다. 말씀하신 내용을받지 못했습니다. MLE 란 무엇입니까 ?? –

+0

maximum likelihood estmation – njj

+0

나는 고립 된 단어 인식을하고 있다고 생각하며, 같은 단어의 몇몇 샘플로 구성된 클래스의 평균과 변수를 연결해야한다. – njj