2013-10-15 2 views
2

내 전화 응용 프로그램을 포켓 스핑크스 음성 인식기와 통합하려고합니다. 내가 얻을 녹음 된 파일 유형은 다음과 같은 유형이다 :포켓 스핑크스가있는 8 비트 웨이브 파일 디코드

Input File  : '5555_9911848379__15-10-14-17-36_.wav' 
Channels  : 1 
Sample Rate : 11025 
Precision  : 8-bit 
Duration  : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors 
File Size  : 44.0k 
Bit Rate  : 88.3k 
Sample Encoding: 8-bit Unsigned Integer PCM 

하지만, 여기 http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx 16 비트 PCM 오디오 16000 HZ에서 샘플링 기대 주어진 샘플 프로그램.

위에서 기록한 파일을 디코딩 할 수있는 방법이 있습니까? 아니면 위의 형식을 16 비트 형식으로 변환해야합니까?

답변

0

위에서 기록한 파일을 디코딩 할 수있는 방법이 있습니까?

아니, 당신이 필요로하는 16 비트

아니면 16 비트 형식으로 위의 형식을 변환해야합니다?

정보가 이미 손실되어 전환이 도움이되지 않습니다. 16 비트 녹음이 필요합니다.

오디오를 적절한 형식으로 녹음하고 있는지 확인해야합니다.

+0

NMS API는 8 비트 11025 Hz 오디오 녹음 만 제공합니다. : api 호출은 vceCreateFile과 vceRecordMessage입니다. – Abhishek

+0

다음 명령을 사용하여 sox를 ​​사용하여 파일을 변환했습니다. sox -V origninalFile.wav -t raw -s -b 16 -L -r 16000 conv.raw 그리고 작동 중입니다. 지금 당장은 내 응용 프로그램이 복잡하지 않아서 작동하는 이유가 있다고 생각합니다. – Abhishek

+1

VCE_ENCODE_PCM8M16 또는 VCE_ENCODE_ALAW 또는 VCE_ENCODE_PCM11M16은 VCE_ENCODE_PCM11M8보다 나은 방법입니다. 자세한 내용은 http://www.nmscommunications.com을 참조하십시오. /manuals/6304-10/chap52.htm –