macos - 将 Mac OSX 听写与语音 API 结合使用

Question

在 OSX Mavericks 中，现在包括语音听写，非常有用。我正在尝试使用听写功能来创建自己的数字生活助手，但我找不到如何使用识别功能在应用程序而不是文本框中获取语音。

我已经研究过 NSSpeechRecognizer，但这似乎是针对使用预定义语法而不是听写来编写可朗读命令的。我使用什么编程语言并不重要，但 Python 或 Java 会很好......

谢谢你的帮助！

score 4 · Accepted Answer

您可以使用SFSpeechRecognizer ( mirror )（需要macOS 10.15 +）：这是为语音识别而设计的。

对实时或预先录制的音频执行语音识别，接收转录、替代解释和结果的置信度。

正如您在问题NSSpeechRecognizer ( mirror ) 中所指出的那样，确实提供了一种“命令和控制”风格的语音识别系统（命令短语必须在听之前定义，与识别文本不受约束的听写系统形成对比）。

另一种方法是直接使用 Mac 听写，但据我所知，唯一的方法是重定向音频源，这不是很整洁，例如参见http://www.showcasemarketing.com/ideablog/transcribe-mp3-audio -to-text-mac-os/ （镜像）。

1 回答 1