0

如何创建 TTS 语音包?

我有一个将文本转换为语音的小应用程序,现在我正在使用微软内置的 tts 包来做文本到语音,但是,我想找一个专业的语音艺术家来创建一个新的文本到语音包。问题是,我不知道如何创建语音包(TTS)

4

1 回答 1

6

为文本转语音引擎创建新语音是一个复杂的过程。这不仅仅是让语音艺术家录制音频并简单地从中创建声音的问题。这方面有很多工作要做(将音频分割成音素;构建语音数据;构建字典;使韵律和音频加入/合成规则正确)。

对于像 Microsoft Text-to-Speech 引擎这样的语音引擎,您还面临着语音格式是专有的问题,因此您无法创建该格式的新语音。您还受到引擎功能的限制。

您目前最好的选择是:

  1. 切换到使用 eSpeak 文本到语音引擎并使用 espeakedit 创建自己的声音(联系开发人员寻求帮助)——这个引擎使用了一种合成方法,使它听起来类似于微软的声音,斯蒂芬霍金的声音是使用,但是很清楚,发音整体很好;
  2. 使用不同的文本到语音引擎,如使用语音记录的 Cepstral(这些听起来更像人类,但我发现韵律不是很好,破坏了生成的音频);
  3. 使用 Cepstral 的服务来创建特定于您需求的语音(这可能很昂贵)。

我正在研究使用来自 librivox.org 的音频数据来生成文本到语音的语音。不过,这可能还需要 3 到 4 年的时间,然后我才能真正发挥作用。

于 2010-07-02T10:43:59.380 回答