谈到 Linux 中的 TTS(文本到语音)库,开发人员有哪些选择?
大多数发行版都附带哪些库?
有最小的图书馆吗?每个库提供什么功能?
我主要从 C++ 的角度来解决这个问题,尽管 Python 也适合我。
谈到 Linux 中的 TTS(文本到语音)库,开发人员有哪些选择?
大多数发行版都附带哪些库?
有最小的图书馆吗?每个库提供什么功能?
我主要从 C++ 的角度来解决这个问题,尽管 Python 也适合我。
Ubuntu 自带 eSpeak,使用起来非常简单。从控制台,只需输入:
espeak "Hello World"
其他选项包括 Festival 和 Flite。Festival 是我迄今为止使用过的最复杂的一个,并且我已经成功安装了新的、不那么人工声音的声音(对于 Ubuntu,请参阅http://ubuntuforums.org/showthread.php?t=677277)。Flite 非常简单,但没有 Festival 那样的可定制性。
例如,如果您想要一个合成语音的 Python 程序,那么有一个名为 PyFestival 的有点不活跃的项目,它非常易于使用 ( http://code.google.com/p/pyfestival/ )。
使用Flite作为您的语音库,然后使用来自节日或 festvox 的声音。