2014-03-31 3 views
1

UNI 프로젝트에 대한 아이디어가 필요합니다.은 오디오 녹음에서 다른 소리/소스를 감지합니다.

다른 오디오 소스에서 오디오 파일을 다른 "스트림"으로 분할 할 수 있는지 궁금합니다. 예를 들어, 오디오 파일을 엔진 소음, 열차 소음, 음성, 항상 존재하지 않는 다른 소리 등으로 나눕니다.

프로그래밍 언어에서는이 작업을 수행 할 필요가 없습니다 Sound Forge와 같은 일부 사운드 프로세싱 소프트웨어를 사용하여 수동으로도 가능합니다. 하지만 이것이 가능한지 먼저 알아야합니다. 나는 소리 처리에 대해 아무것도 모른다.

첫 번째 단계가 완료되면 (사운드 분리) 처리 된 사운드 중 하나가 다른 오디오 레코딩에 있는지 확인하고 싶습니다. 그 목적은 소리 감지입니다. (이상적인) 예를 들어, 자동차 엔진 사운드를 가져 와서 다른 파일과 비교하고 오디오가 자동차 엔진의 레코딩인지 아닌지를 결정하십시오. 그게 정확할 필요는 없습니다. 나는 일정하지 않은 소리를 감지합니다. 괜찮을거야.

나는 프로그래밍 부분을 할 것이고, 나는 무엇을 찾을 것인가 (소프트웨어, 수학 등)에 대한 조언이 필요할 것이다. 나는 사운드 전문가가 아니기 때문에 가능한 경우 흥미로운 프로젝트가 될 것입니다.

감사합니다.

답변

0

매우 단일 오디오 스트림에서 자동화 된 소스 분리가 어렵습니다. 당신의 두뇌는이 작업을 아주 잘하며 스테레오 신호의 이점도 있습니다.

예를 들어. 음성은 항상 존재하지 않는 신호로 가득 차 있습니다. 차량 소음은 고정되어 있지만 기어 변경은 이상 치입니다.

불행히도 간단한 대답은 없습니다.

+0

사실, 수동으로 완료 할 때 소리가 ***로 분리되는 것을 기대할 수 있습니다 (또는 자동으로 불가능할 수도 있습니다). 그래서 2 단계에서 분리하여 사용해야하는 제한된 수의 소리로 작업하고 싶습니다. 감사합니다. – user3481244

+0

@ user3481244 : 아마도 좀 더 정교해야 했었을 것입니다. ** hte ** 엔진 사운드와 같은 것은 없습니다. 엔진과 유사한 사운드가 있습니다. 혼합 신호에서도 클래스를 인식하는 것은 상당히 쉽습니다. 하지만 정확히 일치하는 것은 아니므로 정확한 엔진 사운드를 뺄 수는 없습니다. 추정치를 빼면 오류는 원래 사운드에 비해 작을 수 있지만 나머지 사운드에 비해 작지는 않습니다. – MSalters

0

오디오 스트림과 참조 신호를 연결합니다. 상호 관계는 FFT를 사용하여 효율적으로 수행 할 수 있습니다. 상관 계산의 출력은 신호 식별을 위해 임계 값 화되고 '디 바운스'될 수 있습니다.

관련 문제