우리는 기계 학습을 사용하여 전체 주파수 도메인에서 많은 잡음을 가질 수있는 오디오 클립에서 사람의 음성을 어떻게 얻을 수 있습니까?기계 학습을 사용하여 오디오 클립에서 사람의 음성을 추출하는 방법은 무엇입니까?
답변
ML 응용 프로그램과 마찬가지로 프로세스가 간단합니다. 샘플을 수집하고, 기능을 분류하고, 분류기를 교육하십시오. 샘플의 경우 잡음이 많은 녹음을 사용하거나 freesound.org와 같은 웹 사운드 컬렉션에서 많은 잡음을 찾을 수 있습니다. 평균 정규화 멜 주파수 계수를 사용할 수있는 기능의 경우 구현을 CMUSphinx speech recognition toolkit에 있습니다. 분류 자의 경우 GMM 또는 SVM을 선택할 수 있습니다. 충분한 데이터가 있다면 꽤 잘 작동 할 것입니다.
정확도를 향상 시키려면 노이즈와 음성이 연속적이라는 가정을 추가하면 모든 프레임을 개별적으로 분석하는 대신 음성 청크를 감지하는 숙취 스키마 (본질적으로 HMM)로 탐지 기록을 분석 할 수 있습니다.
이것에 대한 좋은 참고 자료를 제공해 주시겠습니까? – user3392464
물론, 어떤 종류의 참조를 찾고 계신가요? –
잡음 분석기의 배경 이론 및 음성 인식을위한 몇 가지 자료. 미리 감사드립니다 !! – user3392464
- 1. 기계 학습을 사용하여 URL을 분류하는 방법은 무엇입니까?
- 2. 기계 학습을 이용한 예측
- 3. 기계 학습을 사용한 텍스트 단순화
- 4. 기계 학습을 사용하여 센서 데이터에서 오류 예측
- 5. 기계 학습을 사용하여 기능에 단어를 어떻게 매핑합니까?
- 6. 기계 학습을 사용하여 퍼즐 게임 AI 개선
- 7. 기계 학습을 공부하기위한 전제 조건은 무엇입니까?
- 8. 기계 학습을 위해 다른 NLP 기능을 결합하는 방법은 무엇입니까?
- 9. 기계 학습을 웹 응용 프로그램과 통합하는 방법은 무엇입니까?
- 10. 두 사람의 음성을 혼합 음성 파일에서 분리하는 방법은 무엇입니까?
- 11. 기계 학습을 통해 겹치는 범주 추출
- 12. 기계 학습을 사용한 X 선 영상의 분류
- 13. 왜 기계 학습을 위해 python의 hstack을 사용합니까?
- 14. 자바에서 오디오 기능을 추출하는 방법은 무엇입니까?
- 15. JFileChooser를 사용하여 텍스트에서 음성을 오디오 파일로 저장
- 16. 기계 학습을 사용한 예측/지연 포기?
- 17. Android 두 사람의 음성을 다르게 인식합니다.
- 18. 오디오/비디오 파일 길이를 추출하는 방법은 무엇입니까?
- 19. Microsoft Azure 기계 학습을 사용하여 Python 스크립트 실행
- 20. 기계 학습을 사용하여 분류를 위해 가속도계 데이터를 저장하는 방법
- 21. 파이썬에서 기계 학습을 사용하여 다른 문자열을 클러스터링하는 방법
- 22. 사람의 목소리를 디지털 형식으로 변환하는 방법은 무엇입니까?
- 23. 오디오 스트림에서 음성을 감지하는 방법
- 24. (PortAudio를 사용하여) 입력 오디오 스트림에서 주파수 정보를 추출하는 방법은 무엇입니까?
- 25. 기계 학습을 위해 theano를 사용하여 하나의 프로세스에서 다중 작업을 처리하는 방법은 무엇입니까?
- 26. JavaScript를 사용하여 음성을 만드는 방법은 무엇입니까?
- 27. 파이썬에서 기계 학습을 위해 누락 된 NaN을 처리하는 방법
- 28. Ajax 학습을 시작하는 방법은 무엇입니까?
- 29. iPhone 용 Core Audio (오디오 장치/원격 IO)에서 녹음 된 음성을 사람의 음성으로 변경하는 방법
- 30. 방랑하는 DC 오프셋을 오디오 클립에서 제거하려면 어떻게합니까?
어떻게 마침내 이것을 해결 했습니까? –