2010-07-02 4 views
2

어떻게 TTS 음성 패키지를 만들 수 있습니까?TTS 패키지 생성

나는 작은 애플 리케이션을 speach로 변환하는 텍스트를 가지고 있는데, 지금은 마이크로 소프트의 내장 된 tts 패키지를 사용하여 speach 텍스트를 만들었지 만, proffesional 음성 아티스트에게 음성 패키지를 발표하기위한 새로운 텍스트를 만들고 싶습니다. . 문제는, 그 음성 패키지 (TTS)를 만드는 방법을 모르겠다

+0

무엇을하려고합니까? 무엇을위한 패키지? (Debian-RPM? 다른 것?) 당신은 어떤 텍스트 음성 변환 프로그램/엔진을 목표로합니까? (eSpeak? Flite? 다른 것?) 더 많은 정보가 없으면 아무런 답을 얻지 못할 것입니다. – reece

+0

나는 텍스트를 speach로 변환하는 작은 응용 프로그램을 가지고 있지만, 지금은 마이크로 소프트의 내장 된 tts 패키지를 사용하여 발표 할 텍스트를 사용하고 있습니다. 그러나 음성 패키지를 발표하기 위해 새로운 텍스트를 작성하는 proffesional 음성 아티스트를 얻고 싶습니다. 문제는, 그 음성 패키지 (TTS)를 만드는 방법을 모르겠다 –

답변

5

텍스트 음성 변환 엔진을위한 새로운 음성을 만드는 것은 복잡한 과정이다. 음성 아티스트가 오디오를 녹음하고 단순히 음성을 생성하는 것은 문제가 아닙니다. 이 작업에는 많은 부분이 포함됩니다 (오디오를 음소로 분할, 음성 데이터 작성, 사전 작성, 운율 및 오디오 조인/합성 규칙 수정).

Microsoft 음성 인식 엔진과 같은 음성 엔진의 경우 음성 형식이 독점적이므로 해당 형식으로 새 음성을 만들 수 없습니다. 당신은 또한 엔진의 능력에 의해 제한됩니다.

순간에 가장 좋은 방법은 다음 중 하나입니다

(이것에 도움을 개발자에게 문의)이 eSpeak를 텍스트 음성 변환 엔진을 사용하고 자신의 목소리를 만들 수 espeakedit를 사용하여 전환
  1. -이 엔진은 MS와 스티븐 호킹 (Howking)이 사용하는 음성과 비슷한 소리를내는 합성 방법을 사용하지만 매우 명확하고 발음은 전반적으로 훌륭합니다.
  2. 음성 녹음을 사용하는 Cepstral과 같은 다른 TTS (텍스트 음성 변환 엔진)을 사용합니다 (이들은 인간과 비슷하게 들리는 경향이 있지만, 운율이 좋지 않아 결과 오디오가 망가지는 것으로 나타났습니다).
  3. Cepstral의 서비스를 사용하여 필요에 맞는 음성을 만듭니다 (비용이 많이들 것 같습니다).

저는 librivox.org의 음성 데이터를 사용하여 TTS (text-to-speech) 음성을 생성합니다. 3 ~ 4 년 정도 걸릴 가능성이 있습니다.

+0

똑똑 ... 고맙습니다 ... 정확하게 내가 무엇을 찾고 있었는지 ... 나는 현재 mbrola 언어 중 하나와 결합 된 eSpeak를 사용하고 있습니다. espeak 편집 비록, 내가 좀 보자. 고맙습니다 –