음성 인식에 새로운 기능이므로 제발 내 잘못을 용서해주십시오. 비상 라디오 방송의 사본을 얻으려고합니다 example1example2. 분명히 진보 된 ASR (자동 음성 인식) 도구로는 아무 것도 이해할 수 없기 때문에 나는 잘못된 것을하고 있습니다.긴급 라디오 녹음의 음성 인식
나는 IBM Watson, Google Speech 및 심지어 Cobalt을 시도했습니다. 그들 중 누구도 오디오에서 가장 기본적인 정보를 수집 할 수 없습니다.
두 부분으로 나뉜 질문이 있습니다. 위의 예와 같은 오디오는 ASR 도구를 통해 사용할 수 있습니까? API를 보내기 전에해야 할 몇 가지 변환이 있습니까?
음성 인식의 작동 원리를 알고 있습니까? – matt