我们有一些经过校对的 .srt 文件,我们想通过 AWS Polly 从中生成音频。根据 AWS Polly 上的参考资料,Polly 的输入类型是纯文本或 SSML 增强文本。有没有办法将 .srt 文件转换为 SSML 增强文本?
我们想使用 .srt 文件,因为它们经过校对并且在文件中记录了“音频暂停”信息。例如:
1
00:00:04,960 --> 00:00:06,880
- [Instructor] Bacteria
are able to inhabit
2
00:00:06,880 --> 00:00:09,220
almost every environment on Earth,
3
00:00:09,500 --> 00:00:12,740
from desert tundra to
tropical rainforests.
00:00:09220 到 00:00:09,500 之间有一个间隔,这是我们拥有的“音频暂停”信息。
AWS Polly 参考:https ://docs.aws.amazon.com/polly/latest/dg/ssml-to-speech-console.html
如果无法将 .srt 转换为 SSML 增强文本,我是否应该解析 .srt 文件以生成 Polly 可以理解的 SSML 增强文本?