我MaryTTS
在Grails Application
. 在应用程序测试期间,我发现使用HMM voice
.
所以很自然地,我通过MARY Web 客户端进行了测试,同时调整了所有 HMM 相关参数(F0Add、F0Scale 和 Rate)以及删除它们或保留默认值,但没有成功。
我使用的声音是bits1-hsmm:5.2
(德国女性)
梯度依赖:
compile "de.dfki.mary:voice-bits1-hsmm:5.2"
代码很简单:
def marytts = new LocalMaryInterface()
marytts.locale = Locale.GERMAN
marytts.generateAudio text
一切正常,直到要转换的文本超过 120 个字符(不仅在代码中,而且通过 Mary Web 客户端)
这是我用于最后一次测试的文本:
Baumaßnahmen im Mai und Oktober Notwendige Instandhaltungsarbeiten an der Münchner S-Bahn-Stammstrecke sollen von nun an gebündelt stattfinden。Die Bahn möchte dadurch die baubedingten Fahrplaneinschränkungen durch gesperrte Gleise geringer halten。
要查看质量差异,请使用文本的一部分(前几个词)与整体。
另一个重点:使用单元选择语音时不会发生这种情况。
我是否缺少诸如配置或特定参数集之类的东西,或者这是 MaryTTS 中 HMM 语音的标准行为?
能够以良好的质量使用这种声音会很棒,因为单元选择声音不能作为独立的依赖项使用,并且必须将文本分成更小的部分并按顺序播放它们并不是我真正会考虑的事情。
任何输入表示赞赏。
更新
进一步的试验和错误表明,当文本包含诸如.
,
:
;
[
]
{
}
. 与文本长度无关!不确定根本原因是什么,但至少在转换之前进行文本操作,语音是可用的。