2014-08-27 4 views
1

이 주제와 관련하여 찾았지만 밀접하게 관련되지 않았기 때문에 답변을 찾지 못했습니다.Java - Wav 오디오 분할

내가 피치 인식을 위해 개발 한 기존의 JAVA 프로젝트를 단순한 모노 포닉 음악 인식으로 확장하려고하지만 웨이브 파일의 세분화가 필요합니다.

그래서, 나는 그것을 얻는다. 나는 파형에서 큰 에너지 존재를 감지해야만한다. 그러나 나는 "산"이 어디에서 시작 하는지를 어떻게 알 수 있을지 아직 확실하지 않다. 때때로 그들은 충분히 명확하지 않습니다. 음표는 매우 빠르게 연주되지 않지만 신호는 거의 0으로 떨어지지 않습니다. 겨우 반으로 떨어질 수도 있습니다.

분할 알고리즘이 하나의 메모 또는 두 개를 놓치지 않는 경우 문제가되지 않습니다. 그 후에 패턴 일치 알고리즘을 갖게됩니다. 샘플 (윈도우 또는 하나씩)을 반복하는 방법과 배열의 어느 부분에 대해 피치 감지를 호출할지 결정하는 방법에 대해 알아야합니다. 가 아닌 JAVA 도구를 사용하여 확인하는 경우이 공유하시기 바랍니다의 오픈 소스 구현 ... 사전

답변

1

에서

감사가있는 경우 , 당신은 sphinx_cont_fileseg를 사용할 수 있습니다. 그것은 스핑크스 음성 인식 시스템의 일부입니다. 그것은 메인 리눅스 배포판의 저장소에 있습니다 (또는 여러분은 단지 소스 코드를 컴파일 할 수 있습니다).

sphinx_cont_fileseg은 오디오 파일의 모든 "음성"세그먼트를 포함하는 텍스트 파일을 생성합니다. 자바 코드에서 실행 한 다음 결과를 다시 파싱 할 수 있습니다. 최적이 아니지만 직접 VAD를 작성하는 것보다 낫습니다.

관련 문제