음성 처리를 처음 사용합니다. 제발 내 용서를 용서해주십시오. 짧은 음성 신호 (10 초)를 받았고 MATLAB 또는 Wavesufer 소프트웨어를 사용하여 수동으로 피치에 주석을달라고 요청했습니다. 이제 어떻게 음성 신호의 음조를 찾는가? 문제를 해결할 수있는 이론적 인 자원이 있습니까? Wavesurfer를 사용하여 신호의 피치 윤곽을 그려 보았습니다. 맞습니까?음성 신호의 수동 피치 추정
편집 1 : 저의 연구는 데이터에 다양한 피치 검출 알고리즘을 적용하여 정확도를 비교합니다. 따라서 수동으로 주석을 추가 한 피치가 참조로 사용됩니다.
업데이트 1 : EGG (dEGG) 신호를 차별화하여 GCI (Glottal Closure Instants)를 얻었으며 dEGG의 피크는 GCI입니다. 두 개의 연속적인 GCI 사이의 시간 간격은 피치주기 (들)입니다. 피치주기의 역수는 피치 (hz)입니다.
업데이트 2 : 시그마는 자동 GCI 탐지를위한 유명한 알고리즘입니다.
모두에게 감사드립니다.
http://www.seas.ucla.edu/spapl/paper/IS110135.pdf – Dschoni
피치를 찾는 데는 여러 가지 방법이 있지만 실제 질문은 "수동으로 주석을 추가"하는 것입니다. 50Hz와 500Hz 사이에 존재하므로, 먼저 하모닉스를 제거하기 위해 저역 통과 필터를 사용하는 것이 가장 좋습니다. 단순히 피치를 수동으로 결정하려는 경우 STFT (스펙트로 그램) 또는 동종 요법과 같은 변형을 사용하는 것이 좋습니다. – GameOfThrows
@GameOfThrows 내 작업은 우리의 데이터에 대해 다양한 피치 검출 알고리즘을 적용하고 정확도를 비교하는 것입니다. 따라서 수동으로 주석을 추가 한 피치가 참조로 사용됩니다. – gokul