2
내 전화 응용 프로그램을 포켓 스핑크스 음성 인식기와 통합하려고합니다. 내가 얻을 녹음 된 파일 유형은 다음과 같은 유형이다 :포켓 스핑크스가있는 8 비트 웨이브 파일 디코드
Input File : '5555_9911848379__15-10-14-17-36_.wav'
Channels : 1
Sample Rate : 11025
Precision : 8-bit
Duration : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors
File Size : 44.0k
Bit Rate : 88.3k
Sample Encoding: 8-bit Unsigned Integer PCM
하지만, 여기 http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx 16 비트 PCM 오디오 16000 HZ에서 샘플링 기대 주어진 샘플 프로그램.
위에서 기록한 파일을 디코딩 할 수있는 방법이 있습니까? 아니면 위의 형식을 16 비트 형식으로 변환해야합니까?
NMS API는 8 비트 11025 Hz 오디오 녹음 만 제공합니다. : api 호출은 vceCreateFile과 vceRecordMessage입니다. – Abhishek
다음 명령을 사용하여 sox를 사용하여 파일을 변환했습니다. sox -V origninalFile.wav -t raw -s -b 16 -L -r 16000 conv.raw 그리고 작동 중입니다. 지금 당장은 내 응용 프로그램이 복잡하지 않아서 작동하는 이유가 있다고 생각합니다. – Abhishek
VCE_ENCODE_PCM8M16 또는 VCE_ENCODE_ALAW 또는 VCE_ENCODE_PCM11M16은 VCE_ENCODE_PCM11M8보다 나은 방법입니다. 자세한 내용은 http://www.nmscommunications.com을 참조하십시오. /manuals/6304-10/chap52.htm –