我想创建一个应用程序来记录您对麦克风说的话并提取所有单词。
我知道这是许多公司和个人都在努力解决的问题,但我不太确定我们离开发擅长这方面的工具还有多远。
此外,是否有任何公开可用的工具来实现这一目标?我希望有一个由 Google Assistant、Apple Siri 或我可以通过上传音频剪辑然后获取所说的话来使用的 API。
我想创建一个应用程序来记录您对麦克风说的话并提取所有单词。
我知道这是许多公司和个人都在努力解决的问题,但我不太确定我们离开发擅长这方面的工具还有多远。
此外,是否有任何公开可用的工具来实现这一目标?我希望有一个由 Google Assistant、Apple Siri 或我可以通过上传音频剪辑然后获取所说的话来使用的 API。
虽然 Google 确实有Google Assistant SDK,但它的主要目的是从您的软件或设备发送音频并从 Assistant 接收音频响应 - 就像您在 Google Home 上一样。同样,Actions on Google旨在处理所有自然语言处理 (NLP) 并为您提供响应,而不是准确地告诉您所说的内容(尽管这是副作用)。
这听起来更像是您想要Cloud Speech API,它是一个语音转文本 (STT) 系统。您可能希望将其与Cloud Natural Language API之类的东西结合起来,然后可以从生成的文本中解析含义。