분류 문제로 사용할 오디오 파일에서 피치 피쳐를 추출하려고합니다. 분류를 위해 python (scipy/numpy)을 사용하고 있습니다.오디오 파일에서 피치 피쳐 추출
scipy.fft
을 사용하여 주파수 기능을 사용할 수 있다고 생각하지만 주파수를 사용하여 음표를 근사하는 방법을 알지 못합니다. 나는 조금 연구를하고 색도 스케일의 음표를 위해 주파수를 12
빈 (bin)으로 매핑하는 크로마 피쳐를 얻을 필요가 있음을 발견했습니다.
필자는 matlab 용 채도 도구 상자가 있다고 생각하지만 파이썬과 비슷한 것은 없다고 생각합니다.
어떻게해야합니까? 누구도 살펴 봐야 할 자료를 제안 할 수 있습니까?
고맙습니다 ... 일반적으로 음악에 대한 피치 감지 또는 dsp 적용에 대한 자료 또는 책을 읽는 것이 좋습니다. –
광범위한 컴퓨터 음악 문제에 대한 일반적인 소개 C. Roads _ The Computer Music Tutorial_ (1994, Cambridge : MIT Press)는 매우 액세스 가능하고 포괄적 인 (> 1000 페이지) 참고서입니다. 필자에게 M. Müllers의 1 부인 _ Music and Motion_ (2007, Berlin, Heidelberg : Springer)에 대한 정보 검색은 훌륭했습니다 (포괄적이지는 않았고 최신 기술이 더 많았습니다). 특정 주제에 관심이 있다면 [ISMIR의 출간] (http://www.ismir.net/proceedings/)은 풍부한 정보의 이음새입니다. 다른 것들은 당신에게 다른 (그리고 더 나은?) 참조를 줄 수 있습니다. 나도 흥미있을거야. –
감사합니다. 나는 그들을 들여다 볼 것입니다. –