2014-09-11 3 views
0

wav 파일의 모든 바이트 배열을 얻을 수 있습니다. 어떻게 가수가 말하고 있는지 말할 때 사용할 수있는 원시 사운드 데이터를 어떻게 디코딩 할 수 있는지 알고 싶습니다. 그의 비트 (나는 적절한 뮤지컬 용어를 모른다. 미안하다)자바 읽기/조작 Wav 파일

누군가가 나를 연결시킬 수있는 API 또는 튜토리얼이 있다면, 나는 좋은 것을 찾을 수없는 것처럼 부풀어 오른다.

+0

이 특정 요구 사항에 대해서는 잘 모르겠지만 오디오 파일의 경우에는 FFMpeg (https://www.ffmpeg.org/)를 사용했습니다. 거기서 좋은 일을 찾을 수 있습니다. 커뮤니티도 꽤 활동적입니다. –

답변

0

미리 알고 싶습니까? 그렇다면 두 신호가 cross correlate 수 있으며이 출력에서 ​​가장 높은 피크는 시간 지연에 해당합니다.

비트 시작 전 사운드에 따라 주파수 도메인으로 변환하고 (FFT 경유) 주파수가 존재하는지 살펴보고 비트가 시작될 때 상당한 변화가 있는지 확인할 수 있습니다.

몇 가지 예/추가 세부 정보가 도움이 될 것입니다.

이 박자의 템포를 찾으려면 모든 것을 말하십시오. 내가 말한 것의 대부분을 개 있습니다.

0

일반적으로 웨이브 파일에서 "무언가가 뛰는 경우"를 감지하는 것은 처음 생각한 것처럼 상상할 수 없습니다.

가능한 첫 번째 단계는 .wav를 소위 "스펙트로 그램"으로 변환하는 것입니다. 자바에는 이러한 목적으로 전용 API가 있다고 생각하지 않지만 "Java 스펙트로 그램"으로 검색하면 많은 타사 예제가 제공됩니다.

또한 this question이 적합 할 수도 있습니다.

P. 저는 신호 처리 전문가가 아니므로 수정을 환영합니다.