2012-07-09 3 views
1

원시 음성 (물론 디지털화 된 음성)을 Google 서버로 전송하면 Google 음성 검색이 작동한다는 것을 알고 Google은 결과를 텍스트 형식으로 반환합니다.Google 음성 검색 대기 시간 및 시간 계산

그 결과는 매우 작습니다 (매우 긴 문장이 아닌 한 ...). 따라서 인터넷을 통해 보내는 데 걸리는 시간은 무시해도 좋을 것입니다 (HTTP 오버 헤드, 서버로드 등을 줄이는 것).

내가 알고 싶은 것은 인터넷 연결 속도 (업 링크)에 대한이 구성 요소의 의존성을 알기 위해 Google의 음성 서버로 전송되는 실제 "아날로그"원시 오디오의 크기 (KB)입니다.

물론 원시 오디오 패킷의 크기는 음성 구문 (한 단어 - 전체 문장 - 매우 긴 문장?)에 따라 달라 지므로이 부분에 대한 통계 정보를 찾고 있습니다 (평균, 기타.).

원시 오디오 패킷이 압축되어 있다는 것도 알고 있습니다. 압축 방법에 대한 모든 정보? (MP3가 아니거나 그럴까요?)

Android 기기와 PC (Chrome 기반)의 압축 방식이 다른가요?

Google 음성 검색을 기반으로 응용 프로그램을 작성할 때 사용되는 알고리즘에 영향을 줄 수 있으므로 직접 프로그래밍 관련 질문으로 보일 수는 없지만 프로그래밍과 직접적인 관련이 있습니다.

+0

http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/을 살펴보십시오. 이 게시물은 Google 크롬의 음성 인식 작업을 보여줍니다. 대부분의 사람들이 만든 가정은 Android가 동일한 서비스를 사용한다는 것입니다. –

답변

2

나는 실제로 Google 서버로 전송되는 데이터의 양을 측정하지만, 음성 검색

  • 기록 16kHz의 샘플 레이트
  • 레코드와
  • 기록을 모노에 대한 합리적인 가정을 할 수 있습니다하지 않은 16 비트 해상도
  • 이 CA의 2 배보다 작은 사이즈

달성 무손실 압축을 적용 1 초 동안 기록하면 (1 * 16,000 * 2)/2 = 16,000 bytes이 소모됩니다.