javascript - 从音频剪辑中提取单词

Question

我想创建一个应用程序来记录您对麦克风说的话并提取所有单词。

我知道这是许多公司和个人都在努力解决的问题，但我不太确定我们离开发擅长这方面的工具还有多远。

此外，是否有任何公开可用的工具来实现这一目标？我希望有一个由 Google Assistant、Apple Siri 或我可以通过上传音频剪辑然后获取所说的话来使用的 API。

score 3 · Accepted Answer

虽然 Google 确实有Google Assistant SDK，但它的主要目的是从您的软件或设备发送音频并从 Assistant 接收音频响应 - 就像您在 Google Home 上一样。同样，Actions on Google旨在处理所有自然语言处理 (NLP) 并为您提供响应，而不是准确地告诉您所说的内容（尽管这是副作用）。

这听起来更像是您想要Cloud Speech API，它是一个语音转文本 (STT) 系统。您可能希望将其与Cloud Natural Language API之类的东西结合起来，然后可以从生成的文本中解析含义。

score 2 · Accepted Answer

Microsoft 有Bing Speech API，用于处理音频和提取所说的话。

他们还有自定义语音服务和说话人识别 API

自定义语音服务用于克服语音识别障碍，例如说话风格、词汇和背景噪音。

可用的帮助文档和示例是一个很好的起点。

javascript - 从音频剪辑中提取单词

2 回答 2

Related

Reference