Q

Google Speech to Text는 어떻게 작동합니까?

2016-06-12 2 views 1 likes

1

나는 Google이 음성 인식 API에서 음성을 텍스트로 변환하는 방법을 알고 싶습니다.Google Speech to Text는 어떻게 작동합니까?

거의 모든 소리를 저장하고 특정 주파수 수준에서 일치 시키거나 "A", "The", "B", "B"와 같은 다른 사운드 패턴의 음성을 분석하는 일부 오디오 인코더 및 디코더 알고리즘을 가지고 있습니까? V ","D ","Hello "등

또한 좋을 것입니다. 어떤 사람이 공유 할 수있는 경우, 오디오 인코딩 방법 및 다른 모든 사운드로 필터링 된 오디오를 저장하는 방법은 다음과 같습니다. -

기타, 드럼 및 음성 재생 사운드가있는 음악을 필터링하고 싶습니다. 기타 사운드가 별도로 제공되는 3 개의 출력에서 별도로 드럼 사운드, 음성 사운드를 별도로 처리하고 음성을 텍스트로 디코딩 할 수 있습니다.

대학 관련 문서 링크 또는 연구 논문은 훌륭합니다.

감사

2016-06-12 John Cargo

A

답변

2

구글 음성 인식기는 here을 설명합니다. 그것을 이해하기 위해서는 우선 Automatic Speech Recognition A Deep Learning Approach 교과서를 먼저 읽어야합니다.

기타와 드럼의 분리는 일반적으로 Non-Negative Matrix Factorization으로 구현됩니다.

2016-06-12 08:50:08

관련 문제