9

在 OSX Mavericks 中,现在包括语音听写,非常有用。我正在尝试使用听写功能来创建自己的数字生活助手,但我找不到如何使用识别功能在应用程序而不是文本框中获取语音。

我已经研究过 NSSpeechRecognizer,但这似乎是针对使用预定义语法而不是听写来编写可朗读命令的。我使用什么编程语言并不重要,但 Python 或 Java 会很好......

谢谢你的帮助!

4

1 回答 1

4

您可以使用SFSpeechRecognizer ( mirror )(需要macOS 10.15 +):这是为语音识别而设计的。

对实时或预先录制的音频执行语音识别,接收转录、替代解释和结果的置信度。

正如您在问题NSSpeechRecognizer ( mirror ) 中所指出的那样,确实提供了一种“命令和控制”风格的语音识别系统(命令短语必须在听之前定义,与识别文本不受约束的听写系统形成对比)。

来自https://developer.apple.com/videos/play/wwdc2019/256/镜像):

在此处输入图像描述

另一种方法是直接使用 Mac 听写,但据我所知,唯一的方法是重定向音频源,这不是很整洁,例如参见http://www.showcasemarketing.com/ideablog/transcribe-mp3-audio -to-text-mac-os/镜像)。

于 2019-06-15T21:01:40.563 回答