오디오 신호 처리에 대한 숙제가있었습니다. 나는 약간의 논문을 읽었고 수식에 대해 혼란 스럽다 : . 이 공식은 44100Hz, 16 비트, 단일 채널 오디오를 처리하는 데 사용됩니다. 오디오는 사전 처리되어 1024 너비 프레임으로 슬라이스됩니다. F(w)
각 프레임의 FFT 계수이며 w with - above
내가 Analyze audio using Fast Fourier Transform 가장 중요한을 많이, 검색 한 22050.
파이썬을 사용한 오디오 신호 처리
, 프레임 속도의 절반입니다. 그러나 나는 아직도 그것을 분명히 이해할 수 없다. 나는 scipy와 numpy의 1024 width 배열을 가진 FFT coeffcients를 가지고있다. 그런 다음 수식을 어떻게 수행합니까? 배열의 0 ~ 512 값의 합계와 같습니까?
누구든지 나를 도울 수 있기를 바랍니다. 미리 감사드립니다.
무엇을 이미 시도 했습니까? 우리는 일반적으로 당신이 시도하는 소스 코드를 볼 것으로 기대합니다. – marko
이고 F (w) * 실제로는 각 프레임의 FFT 계수입니까? 내게는 기능처럼 보입니다. 그것에 대한 방정식을 보는 것이 유용 할 수 있습니다. – marko
Google 및 stackoverflow에서 많이 검색했습니다. 나는 내가 생각하기에 가장 유용한 자료를 주었다. 나는 오디오 신호를 읽고 그것을 전처리하고 그것을 프레임으로 조각 낸다. 프레임에서 FFT를 수행했습니다. 내가 가진 것은 FFT 계수이다. 그러나 FFT 계수를 사용하여 수식을 수행하는 방법을 모르겠습니다. 나는 또한'F (w)'가 방정식이되기를 바란다. 그렇다면 여기에 올 필요가 없습니다. 제가 읽은 모든 논문은'F (w)'가 각 프레임의 FFT 계수라고 말합니다. @ 마르크 – zhangyangyu