2012-07-28 6 views
4

개 껍질을 기록하고 파일을 저장하고 여러 종류의 껍질 (경고 껍질, 울기 나무 껍질 등)이 포함 된 여러 파일과 비교하고 싶습니다.두 개의 오디오 파일 일치하기

일치를 얻기 위해 어떻게 비교할 수 있습니까? 이 유형의 앱에서 수행해야 할 프로세스는 무엇입니까?

팁 주셔서 감사합니다.

+2

최선의 방법은 스펙트럼 분석가가하는 것이라고 생각합니다. FFT (Fast Fourier Transform)를 사용하여 껍질의 스펙트럼을 얻고 스펙트럼을 비교하십시오. 분석가를 돕기 위해 일부 필터를 정의 할 수 있습니다. 재미있게 보내십시오. – cliff2310

+0

THank you @ clif2310. 그것을 달성하는 또 다른 방법이 있습니까? FFT를 사용하면 상당히 복잡하기 때문에 공부하고 구현하는 데 많은 시간을 필요로합니다. – pindleskin

+2

FFT는 여기서 빙산의 일각에 불과합니다. 필자는 프로세스의 한 부분에서 FFT를 사용하는 오디오 핑거 프린팅을 구현했습니다. 단지 두 개의 청각 적으로 동일한 사운드 조각 만 일치시킵니다. 문제는 그것보다 훨씬 큽니다. 어쨌든 아마 당신은 아마 당신의 안드로이드 장치가 오디오를 얻고 비교를 할 것 인 서버에 그것을 보내는 어떤 서버 측 해결책을 사용하는 것을 끝낼 것이다. shazaam, playkontrol 또는 soundhound를 조사하십시오 ... –

답변

3

문제에 대한 간단한 대답은 없습니다. 그러나 우선, 오디오 지문 인식이 어떻게 작동하는지 살펴볼 수 있습니다. 이 논문은 와우의 창조자에 의해 쓰여진 훌륭한 시작이다 :

http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf

내가 그 접근 방식은 개 짖는 소리에 대해 어떻게 작동하는지 잘 모르겠지만, 유용 할 수 있습니다 몇 가지 개념이있다.

살펴볼 또 다른 사항은 FFT가 작동하는 방식입니다. 다음은 FFT를 사용하는 방법 중 하나 인 피치 추적을 위해 작성한 코드가 포함 된 자습서입니다. 음색과 피치가 주어진 강아지의 포르 만트 구조와 어떻게 상호 작용하는지 더 자세히보고 있습니다. 따라서 파생하려는 매개 변수에는 기본 피치 (딱딱 소리를 다른 종류의 껍질과 구별하기에 충분할 수 있음) 및 기본 피치 대 고조파 비율이 포함될 수 있습니다. 이는 껍질이 얼마나 공격적인지 식별하는 데 도움이됩니다. ') 여기에 약간의 추측 M : 약간의 중복이있을 것 같은

http://blog.bjornroche.com/2012/07/frequency-detection-using-fft-aka-pitch.html

마지막으로, 당신은, 기본 음성 인식 및 음성 처리에 몇 가지 조사를 수행 할 수 있습니다. Wikipedia는 아마 당신을 시작할 수있을만큼 충분할 것입니다.

EDIT : 아, 또한 비교를 위해 사용할 매개 변수를 확인한 후에는 여러 매개 변수가있는 소리의 데이터베이스와 여러 매개 변수를 비교하는 방법이 필요합니다. 나는 shazam 기사의 기법이 효과가 있다고 생각하지 않습니다. 시도 할 수있는 한 가지는 Logistic Regression입니다. 다른 옵션이 있지만 가장 간단한 방법 일 것입니다. 안드로이드에서 작동하고 두 개의 오디오 파일에 대한 유사성 측정을 제공하므로 http://code.google.com/p/musicg/

그것은 자바의 :

1

나는 구글의 오픈 소스 LIB musicg API를 체크 아웃 것입니다.

+0

이 기능을 통합하기위한 링크 나 코드 샘플을 제안 해 주시겠습니까?나는 또한 같은 문제에 직면하고있다. –

관련 문제