2011-09-09 5 views
2

저는 오디오 파싱을 사용하여 잠시 동안 놀고 싶었지만 지금하고 싶은 일에 대해 올바른 라이브러리를 찾을 수 없었습니다.시간 간격으로 속성에 대한 오디오 데이터 분석

나는 기본적으로 단지 사운드 파일을 파싱하고 진폭/주파수 및 기타 관련 정보를 노래 (예 : 10ms 정도) 중에 특정 시간에 얻고 싶습니다. 예를 들어 노래의 속도가 빨라진 곳의 데이터를 그래프로 나타낼 수 있습니다 많이 그리고 그것이 정말로 큰 소리로 도착하는 곳.

나는 OpenAL을 꽤 많이 보았지만,이 기능을 제공하는 것처럼 보이지 않는다. 어디서부터 시작해야 할지를 알지 못했다. 누구든지이 일을하거나이 일을 할 수있는 도서관을 사용했다면 올바른 방향으로 나아갈 수 있습니다. 감사!

+0

헤드 업 :이 질문은 신호 처리에 관한 강의에서 끝납니다. 나는 그것을주지 않을 것이다, 나는 자격이 없다. –

+0

@Chris 무슨 뜻이야? – bobl

+0

디지털 (양자화 된) 오디오 소스를 의미있는 것으로 바꾸는 것에 대해 묻습니다. (노래가 빠르게 움직이는 곳을 찾는 것과 같습니다.) 그 자체로 연구의 전체 분야입니다. –

답변

1

오디오 파일을 구문 분석하고 디코딩하기 위해 Windows/OSX/Linux에서 실행되며 오픈 소스 (LGPL 라이센스) 인 libsndfile으로 좋은 결과를 얻었습니다. 이 라이브러리는 mp3 (저작자가 라이센스 문제를 피하기를 원함)를 지원하지 않지만 FLAC 및 Ogg/Vorbis를 지원합니다.

닫힌 소스 라이브러리로 작업하는 것이 문제가되지 않는다면 흥미로운 옵션은 Apple의 Quicktime SDK 일 수 있습니다. 이 SDK는 OSX 및 Windows에서 사용할 수 있으며 등록 된 개발자는 무료입니다 (무료로 Apple 개발자로 등록 할 수 있음). QT SDK를 사용하면 Quicktime Player가 지원하는 모든 파일 형식을 구문 분석 할 수 있으며 여기에는 .mp3이 포함됩니다. SDK를 사용하면 QuickTime에서 설치 한 모든 코덱에 액세스 할 수 있으므로 .mp3 파일을 읽고 PCM으로 디코딩 할 수 있습니다. 이 SDK를 사용하려면 무료 QuickTime Player가 설치되어 있어야합니다.

신호 처리 라이브러리에 관한 한, 내 자신의 기능을 (음성 인식 용으로, 호기심이있는 경우를 대비하여) 작성 했으므로 솔직히 어떤 것도 추천 할 수 없습니다. 흥미로운 것으로 보이는 몇 가지 오픈 소스 프로젝트가 this page에 나와 있습니다.

PCM 샘플에서 처리 할 필요없이 쉽게 사용할 수있는 진폭 데이터 분석 작업과 같이 간단한 작업을 시작하는 것이 좋습니다. 데이터를 시각화 할 수 있다는 것은 매우 유용합니다. 저는 Audacity이 훌륭한 시각화 도구라는 것을 알았습니다. 오픈 소스이기 때문에 내부에 자체 테스트를 할 수 있습니다.

행운을 빈다.

+0

참고 자료를 보내 주셔서 감사합니다. 흥미있는 주제. – bobl

관련 문제