2016-09-06 2 views
1

음성 처리를 처음 사용합니다. 제발 내 용서를 용서해주십시오. 짧은 음성 신호 (10 초)를 받았고 MATLAB 또는 Wavesufer 소프트웨어를 사용하여 수동으로 피치에 주석을달라고 요청했습니다. 이제 어떻게 음성 신호의 음조를 찾는가? 문제를 해결할 수있는 이론적 인 자원이 있습니까? Wavesurfer를 사용하여 신호의 피치 윤곽을 그려 보았습니다. 맞습니까?음성 신호의 수동 피치 추정

편집 1 : 저의 연구는 데이터에 다양한 피치 검출 알고리즘을 적용하여 정확도를 비교합니다. 따라서 수동으로 주석을 추가 한 피치가 참조로 사용됩니다.

업데이트 1 : EGG (dEGG) 신호를 차별화하여 GCI (Glottal Closure Instants)를 얻었으며 dEGG의 피크는 GCI입니다. 두 개의 연속적인 GCI 사이의 시간 간격은 피치주기 (들)입니다. 피치주기의 역수는 피치 (hz)입니다.

업데이트 2 : 시그마는 자동 GCI 탐지를위한 유명한 알고리즘입니다.

모두에게 감사드립니다.

+0

http://www.seas.ucla.edu/spapl/paper/IS110135.pdf – Dschoni

+0

피치를 찾는 데는 여러 가지 방법이 있지만 실제 질문은 "수동으로 주석을 추가"하는 것입니다. 50Hz와 500Hz 사이에 존재하므로, 먼저 하모닉스를 제거하기 위해 저역 통과 필터를 사용하는 것이 가장 좋습니다. 단순히 피치를 수동으로 결정하려는 경우 STFT (스펙트로 그램) 또는 동종 요법과 같은 변형을 사용하는 것이 좋습니다. – GameOfThrows

+0

@GameOfThrows 내 작업은 우리의 데이터에 대해 다양한 피치 검출 알고리즘을 적용하고 정확도를 비교하는 것입니다. 따라서 수동으로 주석을 추가 한 피치가 참조로 사용됩니다. – gokul

답변

1

일반적으로 지상 진실은 EGG 녹음과 함께 신호에서 얻습니다. EGG는 Electrogastrogram의 머리 글자로, 실제 음조를 녹음하는 특수 장치입니다.

나는 그러한 장치에 대한 액세스 권한을 갖고 있지 않으므로 해당 작업을 위해 신중하게 준비된 피치 추출 평가를 위해 기존 데이터베이스를 사용하는 것이 좋습니다. here을 다운로드 할 수 있습니다. 이 데이터는 University of Edinburgh에서 Paul Bagshaw가 수집했습니다.

나는 그의 논문도 읽으시기 바랍니다.

피치 추출을위한 최첨단 알고리즘 인 https://github.com/google/REAPER과 비교하려는 경우. 또한 "참"피치는 후속 알고리즘을위한 최상의 기능이 아닐 수도 있습니다. 언젠가 당신은 실수로 피치를 추출 할 수 있지만 예를 들어 음성 인식과 같은 더 나은 정확도를 얻을 수 있습니다. 자세한 내용은 this publication을 확인하십시오.

+0

사실 나는 해당 신호에 대한 EGG 신호를 가지고 있습니다. – gokul

+1

그러면 EGG에서 REAPER로 피치를 추출 할 수 있습니다. 이는 진상을 의미합니다. 이 방법론은 http://tcts.fpms.ac.be/publications/papers/2013/icassp2013_obtdndatd.pdf 섹션 3에서 확인할 수 있습니다.2 진실 –

+0

감사합니다. 정말 도움이되었습니다. – gokul