누군가가 오디오 스트림에서 말하는 것을 결정해야합니다. 해밍 창을 적용하고 FFT를 계산했습니다. 여기서 어떻게 인간의 목소리를 감지하나요?오디오 스트림에서 음성을 감지하는 방법
2
A
답변
1
이 경우 FFT를 수행 할 필요가 없으므로 Voice Activity Detection 알고리즘을 구현해야합니다.
2
자신 만의 음성 활동 감지 알고리즘을 실험 해 보려면 FFT를 초기 단계로 사용할 수 있습니다. 다음으로는 특성화 된 고정 스펙트럼 노이즈 배경을 빼는 것이 좋습니다. 그런 다음 수정 된 FFT 결과를 사용하여 피쳐 추출에 대한 st 스트 럼 (또는 일부 가중 c 스트 coefficients 계수)을 계산할 수 있습니다. 그런 다음 추출한 모든 특징 벡터에 대해 통계적 패턴 일치를 수행하고 결과를 결정 알고리즘에 제공 할 수 있습니다.
위의 각 단계는 연구 주제 일 가능성이 높습니다. 훌륭한 구현 방법은 대학 도서관에서 찾을 수있는 수십 개의 게시 된 연구 논문을 연구하는 것입니다.
+0
고마워, 나는 그것에 대해 조사 할 것이다. – user1019710
관련 문제
- 1. 오디오 스트림에서 특정 단어의 발생을 감지하는 방법.
- 2. 내 iPhone 앱에서 음성을 감지하는 방법은 무엇입니까?
- 3. PyTTS의 오디오 스트림에서 mp3 인코딩
- 4. 오디오 스트림에서 메타 데이터 추출
- 5. SUSE Linux 시스템에서 오디오 가용성을 감지하는 방법
- 6. 현재 오디오 장치 볼륨을 감지하는 방법
- 7. 응용 프로그램이 절전 모드 일 때 음성을 감지하는 방법은 무엇입니까?
- 8. 화자의 음성을 바꾸는 방법?
- 9. 자바 스크립트를 사용하여 비디오 스트림에서 오디오 추출
- 10. 오디오 스트림에서 SMPTE 타임 코드 추출
- 11. 아이폰에 음성을 녹음하는 법?
- 12. 실시간 스트림에서 오디오를 재생하는 방법
- 13. vb6에서 Google 음성을 실행하는 방법
- 14. Blackberry Storm의 라이브 오디오 스트림에서 노래 이름을 추출하는 방법은 무엇입니까?
- 15. 페이지에서 자동 오디오 플래시를 감지하는 방법은 무엇입니까?
- 16. C#을 사용하여 스트림 또는 tcplistener 또는 오디오 카드의 오디오 레벨을 감지하는 방법 #
- 17. 오디오 트랙에서 배경 잡음을 제거하는 방법?
- 18. (PortAudio를 사용하여) 입력 오디오 스트림에서 주파수 정보를 추출하는 방법은 무엇입니까?
- 19. 스트림에서 바이트를 건너 뛰는 방법
- 20. 스트림에서 이스케이프 시퀀스를 제거하는 방법
- 21. 인식하기 전에 입력 음성을 얻는 방법
- 22. android : 음성을 사용하여 장치를 잠그는 방법
- 23. 가속도계를 사용하여 음성을 변경하는 방법 (자동 튜닝)
- 24. Wiktionary API를 쿼리하고 음성을 얻는 방법
- 25. ios SDK의 음성을 텍스트로 변환하는 방법
- 26. iPhone에서 AVAudioRecorder를 사용하여 음성을 인식하는 방법
- 27. iPhone 용 Core Audio (오디오 장치/원격 IO)에서 녹음 된 음성을 사람의 음성으로 변경하는 방법
- 28. StreamReader 스트림에서 파일 작성하기
- 29. Phonological 수준에서 음성을 텍스트로 출력하는 소프트웨어가 있습니까?
- 30. .ima4 오디오 파일을 웹 사이트에서 재생하는 방법
음, FFT에서 음성을 감지하고 싶습니다. 내가 할 수 있을까? – user1019710
VAD를위한 알고리즘이있을 때 바퀴를 다시 발명하고 싶은 이유가 명확하지 않습니다. 내가 링크 된 Wikipedia 페이지를 읽었습니까? –
예, 읽고 질문에 관련된 내용을 찾지 못했습니다. – user1019710