2012-03-25 2 views
1

음성을 텍스트로 변환하는 API를 사용하여 mp3를 실행하는 데 필자는 프로그램과 라이브러리를 장기간 묶어서 구축하려고합니다. 파일을 사람이 읽을 수있는 텍스트로 변환합니다. 이 온라인 작업을 수행하는 API가 거의 없다는 사실에 놀랐습니다. speech2text 프로젝트는 Google의 비공식적 인 Speech-To-Text API에 연결되는 https://github.com/taf2/speech2text입니다.flac : "오류 : 입력 파일에 ID3v2 태그가 있습니다."

이것은 실제로 처음에 작동했습니다. 몇 가지 수동 전환을 수행했으며 그 결과에 만족했습니다. 그러나 Java에서 프로세스 체인을 자동화하려고 시도한 후 제대로 작동하지 않습니다.

EDIT - 다음 오류 메시지는 기술적으로 speech2 텍스트가 아닌 flac 자체로부터 얻은 것입니다. 이 파일을 flac 만 사용하고 speech2text를 사용하지 않고 변환하려고하면 id3v2 오류 메시지가 표시되므로 speech2text와 오류가 실제로 발생하지 않습니다 (speech2text가 잘못된 태그의 소스 일 수 있음).

Java는 이것을 오류 (스트림을 ProcessBuilder를 사용하여 호출 speech2text을 가진 밖으로 인쇄 후) : 코스의

ERROR: input file ./chunk-abortion-test-audio-0.mp3 has an ID3v2 tag /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:59:in to_flac': failed to convert chunk: ./chunk-abortion-test-audio-0.mp3 with flac ./chunk-abortion-test-audio-0.mp3 (RuntimeError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:18:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:in each' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19

그러나

/Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_inspector.rb:50:in initialize': undefined method first' for nil:NilClass (NoMethodError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in new' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in initialize' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in new' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19

, 같은 파일에 수동으로 명령을 실행하려고하면 실제로 저에게이 있습니다 아이러니 내가 여기에 내가 실제로 id3v2 태그 파일을 정리했습니다. Mac 터미널에서 id3v2 --delete-all을 사용합니다. 그래서 무언가가 계속되고 있습니다.

아무도 무슨 일이 일어나고 있는지 제안 할 수 있습니까? 또한 speech2text가 1 년 만에 업데이트를 보지 못했다는 사실을 감안할 때 사람들이 사용하는 최신 음성 - 텍스트 솔루션이 있어야하는 것 같습니다. 그래서 거기에 더 나은 것이 있으면 알려주세요.

건배!

EDIT - 덧붙여 말하자면 누군가 mp3 파일이 ffmpeg를 사용하여 .flv 파일을 스트립하는 것으로부터 시작된 것이라면.

답변

0

이제 두 가지 문제가 있습니다. ID3v2 문제 .mp3 파일 사용을 회피하고 대신 .wav를 사용하여 해결할 수있었습니다. Java 출력은 여전히 ​​문제이므로 새로운 질문으로 이동하고 있습니다.

관련 문제