是否有可能在进行处理后,我可以使用 SDK 将某个文本结果转换为语音。或者说将警报或警告信息转换为语音,例如。“你已经开着油了”等。
2 回答
不确定这会有多大帮助,但您可能需要查看 IfTTT(如果这比那)应用程序。
我知道他们有一堆预制的小程序,你可以在 Google Assistant API 上运行它们,你也可以自己制作!例如,如果您有巢穴火灾警报器,您可以让助手和警报器相互交谈。
例如,在我的 Google Assistant Raspberry Pi 上,我可以指示它改变恒温器的温度。我还可以将其设置为提供自定义(通常是肱骨),回复特定命令。我知道你可以给它命令,它会返回一个自定义的 TTS 响应。但我不确定您是否可以让它读取您的设备并给出自动响应(例如,如果 Nest Alarm 检测到火灾,则发送消息“火灾!出去!”给助手)。很确定这是目前的一种方式。希望这有帮助,干杯!
听起来您正在寻找可以生成文本到语音 (TTS) 的东西。
虽然 TTS 是 Assistant SDK 的一个组件,但它的设计目的远不止于此。Assistant SDK 还执行语音到文本 (STT) 以解析人所说的内容,并提供一种通过此接口访问 Google Assistant 和 Actions 的方法。因此,虽然帮助构建一个烟雾探测器会很有用,如果你问它也可以提供有关防火的信息 - 它真的不擅长提供音频输出。
你有两个选择:
您可以预先录制音频。您已经建议您要对其他声音执行此操作,因此这是合乎逻辑的下一步。这对于安全系统来说可能是最合理的,因为它需要最少的网络交互并且不会有任何延迟。
您可以使用专用于 TTS 生成的云 API,例如Amazon Polly
更新更清楚:
Assistant SDK 旨在提供对 Google Assistant 的访问。STT 和 TTS 是副作用,在当前版本(开发者预览版 1)中无法直接访问这些组件。
现在,您必须通过音频将所有命令发送到 SDK。无法发送文本命令。因此,虽然理论上您可以创建一个接收命令并做出回应的动作 - 您发送的命令必须是音频流。因为首先只录制您想要播放的音频更有意义,所以这在您的应用程序中不是很有用。
将来,可能可以发送文本命令并获得音频回复,如果/当这样的事情存在时,使用 Assistant SDK 和 Action 拼凑一个 TTS 系统更加可行。但这将是一种非常骇人听闻的方式。
似乎也没有办法通过其他 Google Cloud API 进行 TTS(尽管有网络和Android库可以这样做 - 这些对您的烟雾探测器并没有真正的帮助)。看起来曾经有一种方法可以使用谷歌翻译来做到这一点,但该功能似乎已被删除。