google-assistant-sdk - 是否可以使用 Google Assistant SDK 将文本转换为语音？

Question

是否有可能在进行处理后，我可以使用 SDK 将某个文本结果转换为语音。或者说将警报或警告信息转换为语音，例如。“你已经开着油了”等。

score 0 · Accepted Answer

不确定这会有多大帮助，但您可能需要查看 IfTTT（如果这比那）应用程序。

我知道他们有一堆预制的小程序，你可以在 Google Assistant API 上运行它们，你也可以自己制作！例如，如果您有巢穴火灾警报器，您可以让助手和警报器相互交谈。

例如，在我的 Google Assistant Raspberry Pi 上，我可以指示它改变恒温器的温度。我还可以将其设置为提供自定义（通常是肱骨），回复特定命令。我知道你可以给它命令，它会返回一个自定义的 TTS 响应。但我不确定您是否可以让它读取您的设备并给出自动响应（例如，如果 Nest Alarm 检测到火灾，则发送消息“火灾！出去！”给助手）。很确定这是目前的一种方式。希望这有帮助，干杯！

score 0 · Accepted Answer

听起来您正在寻找可以生成文本到语音 (TTS) 的东西。

虽然 TTS 是 Assistant SDK 的一个组件，但它的设计目的远不止于此。Assistant SDK 还执行语音到文本 (STT) 以解析人所说的内容，并提供一种通过此接口访问 Google Assistant 和 Actions 的方法。因此，虽然帮助构建一个烟雾探测器会很有用，如果你问它也可以提供有关防火的信息 - 它真的不擅长提供音频输出。

你有两个选择：

您可以预先录制音频。您已经建议您要对其他声音执行此操作，因此这是合乎逻辑的下一步。这对于安全系统来说可能是最合理的，因为它需要最少的网络交互并且不会有任何延迟。
您可以使用专用于 TTS 生成的云 API，例如Amazon Polly

更新更清楚：

Assistant SDK 旨在提供对 Google Assistant 的访问。STT 和 TTS 是副作用，在当前版本（开发者预览版 1）中无法直接访问这些组件。

现在，您必须通过音频将所有命令发送到 SDK。无法发送文本命令。因此，虽然理论上您可以创建一个接收命令并做出回应的动作 - 您发送的命令必须是音频流。因为首先只录制您想要播放的音频更有意义，所以这在您的应用程序中不是很有用。

将来，可能可以发送文本命令并获得音频回复，如果/当这样的事情存在时，使用 Assistant SDK 和 Action 拼凑一个 TTS 系统更加可行。但这将是一种非常骇人听闻的方式。

似乎也没有办法通过其他 Google Cloud API 进行 TTS（尽管有网络和Android库可以这样做 - 这些对您的烟雾探测器并没有真正的帮助）。看起来曾经有一种方法可以使用谷歌翻译来做到这一点，但该功能似乎已被删除。

google-assistant-sdk - 是否可以使用 Google Assistant SDK 将文本转换为语音？

2 回答 2

Related

Reference