2013-06-11 3 views
0

오디오 신호 처리에 대한 숙제가있었습니다. 나는 약간의 논문을 읽었고 수식에 대해 혼란 스럽다 : enter image description here. 이 공식은 44100Hz, 16 비트, 단일 채널 오디오를 처리하는 데 사용됩니다. 오디오는 사전 처리되어 1024 너비 프레임으로 슬라이스됩니다. F(w) 각 프레임의 FFT 계수이며 w with - above 내가 Analyze audio using Fast Fourier Transform 가장 중요한을 많이, 검색 한 22050.
파이썬을 사용한 오디오 신호 처리

, 프레임 속도의 절반입니다. 그러나 나는 아직도 그것을 분명히 이해할 수 없다. 나는 scipy와 numpy의 1024 width 배열을 가진 FFT coeffcients를 가지고있다. 그런 다음 수식을 어떻게 수행합니까? 배열의 0 ~ 512 값의 합계와 같습니까?

누구든지 나를 도울 수 있기를 바랍니다. 미리 감사드립니다.

+0

무엇을 이미 시도 했습니까? 우리는 일반적으로 당신이 시도하는 소스 코드를 볼 것으로 기대합니다. – marko

+0

이고 F (w) * 실제로는 각 프레임의 FFT 계수입니까? 내게는 기능처럼 보입니다. 그것에 대한 방정식을 보는 것이 유용 할 수 있습니다. – marko

+0

Google 및 stackoverflow에서 많이 검색했습니다. 나는 내가 생각하기에 가장 유용한 자료를 주었다. 나는 오디오 신호를 읽고 그것을 전처리하고 그것을 프레임으로 조각 낸다. 프레임에서 FFT를 수행했습니다. 내가 가진 것은 FFT 계수이다. 그러나 FFT 계수를 사용하여 수식을 수행하는 방법을 모르겠습니다. 나는 또한'F (w)'가 방정식이되기를 바란다. 그렇다면 여기에 올 필요가 없습니다. 제가 읽은 모든 논문은'F (w)'가 각 프레임의 FFT 계수라고 말합니다. @ 마르크 – zhangyangyu

답변

0

(scipy 수입에) 당신이 파이썬에서 위의 공식을 계산하는 것입니다 당신이 다음 신호 x = [ x_1, x_2, ..., x_N ]있어 가정 : 나는 100 % 확실하지 않다 정규화 계수 N = len(x) 소개

E = sum(abs(fft(x))[:len(x)/2]**2)/len(x) 

-이에 따라 달라집니다 fft의 정확한 구현.

+0

적분에서 dw와 한계는 어떨까요? – tom10

+0

실제로 그것이 내가 생각하는 것입니다 : 나는 여기에 통합이 의미가 없도록 배열만을 얻습니다. 신문은 모두 그것이 통합이라고 말해 주지만, 나는 그것이 실제로 의미하는 것이 합계라고 생각합니다. – zhangyangyu

+0

물론 integrals는 이론적으로 만 존재합니다. 실제로 실제 데이터를 처리 할 때 항상 합계를 계산합니다. –