我注意到当我输出个位数后跟一个<break>
. 我正在使用德国女声 1。我有以下 SSML 标记来重现此行为:
<speak>
<prosody rate="medium">
<s>
<say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">0</say-as>
</s>
</prosody>
</speak>
我还想提供一个指向 mp3 的链接(使用 TTS 模拟器生成,德语,女声 1)。您可以清楚地听到噪音,尤其是在数字 0、2、3、4、6、7 之后。这种效果似乎只有在 a<break>
之后才会出现<say-as interpret-as="cardinal">
。
我希望这样的 SSML 标记完全没有背景噪音。
我使用上面的标记告诉用户一个电话号码,因为<say-as interpret-as="telephone">01234567890</say-as>
拼写数字太快了。