2017-11-18 3 views
1

그래서 음성 인식 프로그램을 작성하고 있습니다. 그렇게하기 위해 TIMIT에서 400MB의 데이터를 다운로드했습니다. 그들은 wav 파일 형식은 'NIST'라는 문제가 그것은 'RIFF'형식이어야합니다 두 경우 모두엄청난 양의 데이터를 NIST에서 RIFF wav 파일로 변경하십시오.

import scipy.io.wavfile as wavfile 
import wave 

(fs, x) = wavfile.read('../data/TIMIT/TRAIN/DR1/FCJF0/SA1.WAV') 
w = wave.open('../data/TIMIT/TRAIN/DR1/FCJF0/SA1.WAV') 

: 나는 wav 파일을 읽을 수 inteded 때 다음과 같은 (I 두 라이브러리를 시도했다). (sph에 관한 것 또한 읽었지 만, donwloaded 한 nist 파일은 .sph가 아닌 .wav입니다.)

내가 SOX를 다운로드 한 후 http://sox.sourceforge.net/ 내 환경 변수에 올바르게 경로를 추가하여 내 cmd가 sox를 ​​인식하도록했습니다. 그러나 나는 그것을 올바르게 사용하는 법을 정말로 알 수 없습니다.

내가 필요로하는 것은 스크립트 또는 뭔가 특정 폴더와 하위 폴더에서 NIST에서 RIFF로 모든 wav 파일 형식을 변경하는 것입니다.

편집 : reading a WAV file from TIMIT database in python에 나는 내가 필요로하는 것은 폴더 아래에 검색하는 스크립트 또는 뭔가가 sph2pipe -f wav input.wav output.wav 실행중인 나를 위해 일한 응답 ... 을 발견, .wav 파일이 포함 된 모든 하위 폴더가 그 라인을 적용 할 코드

+0

해보십시오 삭스 recital.nist의 recital.riff –

+0

삭스는 형식을 FAIL : 열 수 없습니다 입력 파일'recital.nist ': 해당 파일이나 대신의 디렉토리 –

+0

'미안 ahaha –

답변

0

좋아, 나는 그것을 마침내 얻었다. 위의 폴더로 이동하여 다음 코드를 실행하십시오.

forfiles /s /m *.wav /c "cmd /c sph2pipe -f wav @file @fnameRIFF.wav" 

이 코드는 모든 파일을 검색하여 파이썬 라이브러리에 대해 읽기 쉽게 만듭니다. 희망이 도움이됩니다!

관련 문제