파이썬으로 그래픽 스펙트럼 분석기를 만들려고합니다.Fast Fourier Transform을 사용하여 오디오 분석
현재 1024 비트의 16 비트 이중 채널 44,100 Hz 샘플 속도 오디오 스트림을 읽고 두 채널의 진폭을 평균합니다. 이제 256 개의 서명 된 반바지가 있습니다. 이제 numpy와 같은 모듈을 사용하여 해당 배열에서 fft를 실행하고 결과를 사용하여 그래픽 스펙트럼 분석기를 만들고 싶습니다. 시작하려면 32 개의 막대가됩니다.
나는 Fast Fourier Transform과 Discrete Fourier Transform에 대한 위키 피 디아 기사를 읽었으나 결과 배열이 무엇을 나타내는지는 아직 분명하지 않다.
[ -3.37260500e+05 +0.00000000e+00j 7.11787022e+05 +1.70667403e+04j
4.10040193e+05 +3.28653370e+05j 9.90933073e+04 +1.60555003e+05j
2.28787050e+05 +3.24141951e+05j 2.09781047e+04 +2.31063376e+05j
-2.15941453e+05 +1.63773851e+05j -7.07833051e+04 +1.52467334e+05j
-1.37440802e+05 +6.28107674e+04j -7.07536614e+03 +5.55634993e+03j
-4.31009964e+04 -1.74891657e+05j 1.39384348e+05 +1.95956947e+04j
1.73613033e+05 +1.16883207e+05j 1.15610357e+05 -2.62619884e+04j
-2.05469722e+05 +1.71343186e+05j -1.56779748e+04 +1.51258101e+05j
-2.08639913e+05 +6.07372799e+04j -2.90623668e+05 -2.79550838e+05j
-1.68112214e+05 +4.47877871e+04j -1.21289916e+03 +1.18397979e+05j
-1.55779104e+05 +5.06852464e+04j 1.95309737e+05 +1.93876325e+04j
-2.80400414e+05 +6.90079265e+04j 1.25892113e+04 -1.39293422e+05j
3.10709174e+04 -1.35248953e+05j 1.31003438e+05 +1.90799303e+05j...
내가 바로이 숫자가 무엇을 나타내는 지 궁금와 나는 각각에 대한 높이의 비율로이 숫자로 변환 할 방법이 배열 내가 NumPy와 사용하여 내 배열에 FFT를 미리 형성 한 후 모습입니다 32 바. 또한 평균 2 채널을 사용해야합니까?
+1이고 새로운 관용어를 배우게하려면 다음 사항을 유의하십시오. 나는 영어 원어민이 아니다.;) – macbirdie
+1 굉장한, 내가 잘못한 것을 이해하는 데 도움이되었습니다. – Davido
+1 - FFT에 대해 이미 알고 있지만 웹에서 가장 일반적인 영어 설명 중 하나입니다. – OldTinfoil