2014-09-19 3 views
1

저는 파이썬 챌린지 수수께끼를 따르고 있습니다. 이제 wav 파일을 분석해야합니다. 나는 프레임을 읽는 파이썬 모듈이 있고,이 프레임은 16 비트 또는 8 비트임을 배웠다.WAV 파일의 실제 데이터는 무엇입니까?

내가 이해할 수없는 것이이 비트가 무엇을 나타내는가? 이 값들은 스피커에 적용되는 전압으로 직접 변환됩니까? (예 : 인수 분해)?

답변

3

비트는 특정 시간에 전기 파형의 전압 레벨을 나타냅니다.

이 같이하면, 디지털 데이터로 sample the waveform at regular intervals를 음파의 전기적 표현 (아날로그 신호)를 변환하려면

청색의 각 도트

enter image description here은 4 비트의 값을 나타낸다 그 시점에서 아날로그 신호의 높이를 나타내는 숫자 (X 축은 시간이고 Y 축은 전압 임).

.WAV 파일에서 이러한 점은 8 비트 숫자 (256 가지 가능한 값 포함) 또는 16 비트 숫자 (65536 가지 가능한 값 포함)로 표시됩니다. 각 숫자가 많을수록 디지털 샘플링의 정확도가 높아집니다.

+0

16 비트 버전이 서명 된 곳을 읽었을 때 샘플의 즉각적인 높이가 자동으로 이동한다는 의미입니까? – Yotam

+1

이것은 0이 X 축 (물결의 중심)의 중간에 있고 음수가 축 아래의 값을 나타내는 것을 의미합니다. –

3

WAV 파일에는 실제로 모든 종류의 것들을 포함 할 수 있지만 가장 일반적으로는 linear pulse-code modulation (LPCM)입니다. 각 프레임에는 각 채널에 대한 샘플이 있습니다. 모노 파일을 다루는 경우 각 프레임은 단일 샘플입니다. 샘플 속도는 채널당 초당 샘플 수를 지정합니다. CD 품질의 오디오는 초당 44,100 번 촬영 ​​한 16 비트 샘플입니다.

이 샘플은 실제로 해당 시점의 압력 수준을 측정합니다. 스피커가 앞뒤로 공기를 압축하여 앞뒤로 진동하는 소리를내는 것을 상상해보십시오. 이 예제의 경우, 샘플 레벨을 스피커 콘의 위치와 같게 만들 수 있습니다.

관련 문제