问题标签 [azure-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
330 浏览

azure - Azure 语音识别未检测到麦克风 SPXERR_MIC_NOT_FOUND

我有一个小示例应用程序来测试语音识别。它适用于某些机器,但不适用于其他机器。在我第一次安装必要的软件包的开发环境中,一切都 100% 正常工作,没有任何问题。但是,我的团队成员无法通过安装我们包含此代码的软件来使其正常工作。我们有混合环境,在某些情况下,我们使用远程桌面和在远程机器上运行的应用程序(因此通过 RDP 进行设备集成)。而且在本地没有 RDP。在这两种情况下,它都不会检测到麦克风。Windows 检测到麦克风。录音机应用程序工作并测试所有工作,所以我们知道麦克风正在被 Windows 识别。

但是,语音 SDK 无法识别它。

我尝试了两种方法。首先,使用FromDefaultMicrophoneInput但不起作用,我将其FromMicrophoneInput改为并指定了麦克风 ID。

使用 NAudio 枚举麦克风,检测到麦克风并列出:

但是,当尝试使用该音频配置实例化 SpeechRecognizer 时:

我们得到 SPXERR_MIC_NOT_FOUND。甚至认为它显然存在并且在 Windows 中的所有其他情况下都可以正常工作,并且 Nadio 可以正常检测到它。

有什么想法吗?

谢谢你j。

0 投票
1 回答
118 浏览

azure - Azure Speech to text 结果未定义 nodejs

我正在尝试使用 userMedia 实现语音到文本。我在成功创建的 Nodejs 服务器文件上的文件中写入流,但是当尝试使用 Azure 将语音转换为文本时fromStreamInput得到未定义的结果。

0 投票
0 回答
74 浏览

c# - Azure 语音服务 - 在 STT 期间不断识别出“嘿”

我正在使用 Microsoft Speech Service 进行语音-文本 (STT) 转换,即识别来自麦克风的语音。我能够将识别出的语音从麦克风转换为文本。所以,我可以用它来实现语音转文本 (STT) 功能。但是,我面临如下所述的问题:-

问题 - 在 STT 期间,当出现沉默时,“嘿”这个词不断被识别

我试图对此进行一些研发,但没有得到太多帮助。附上相同的屏幕截图。

有什么理由让“嘿”这个词得到认可以及如何消除它?

如果有人对如何进行有任何建议,将不胜感激在此处输入图像描述

0 投票
1 回答
166 浏览

java - Microsoft Azure Speech to Text Java 问题:使用代理时出现 ConnectionFailure

我正在尝试在以下位置获取 Microsoft Azure Speech To Text Java 快速入门: Java 快速入门按说明工作。

我还不能这样做。运行代码时,Eclipse 控制台上显示以下错误:

我已尝试在 Azure 控制台中为我的 Azure 语音资源重新生成SpeechSubscriptionKey 。centralindia用作serviceRegion

  • 我有免费试用订阅。
  • JDK 版本:1.8.0_231适用于 64 位。
  • 操作系统:微软视窗 10
  • IDE:日食月神

我在使用代理服务器的网络中。我在将代理设置配置为后尝试:

还是不行。
PS:我有一个连接到系统的工作麦克风。

0 投票
1 回答
233 浏览

python-3.x - 尝试通过 kudu 控制台在 python azure 函数中添加模块(speech_py_impl),但面临虚拟环境问题

以下是我尝试从函数(voicetotext)文件夹创建虚拟环境时出现的错误,

请指导如何将模块导入天蓝色函数(python)

函数的初始错误是“没有名为 Speech_py_impl 的模块”...从互联网上读到我们应该添加包“libasound2”。当我尝试通过 kudu 添加这个模块时,我很震惊。如果有任何替代方案也请告知。谢谢!

0 投票
1 回答
421 浏览

python - 我们如何使用 python 将输入文件从存储容器提供给 azure Speech api

下面是代码,

错误,

请帮助我们从存储容器中读取音频文件作为 Azure 语音 api 中的输入。谢谢!!

0 投票
1 回答
106 浏览

azure - Azure Speech to Text:自定义语音模型 - 相关文本“继续”

我们正在使用 Azure 的认知服务/语音转文本运行自定义语音模型,我遇到了用户报告的“继续”被转录为“继续”的问题。事实证明,我们的相关文本中有“继续” - 这解释了原因。

但是,相关文本最初是用“继续”(而不是“继续”)一词上传的。这是一个只有一个单词的示例:

在此处输入图像描述

文本文件是带有 BOM 的 UTF-8

有没有其他人看过这个?

0 投票
2 回答
248 浏览

c# - 从 AudioSource 数据 Unity C# 语音到文本 Azure

我想使用 Speech to Text Azure 服务来翻译 AudioSource 对象的音频(剪辑)。怎么做?

0 投票
0 回答
39 浏览

speech-recognition - 已识别文本中不需要的插入

有没有办法在自定义语音工作室中删除我的自定义语音项目中的插入结果?

我的音频是葡萄牙语,我的成绩单也是。训练后的测试结果插入了一个不需要的词。这个不需要的词会以这种方式损害语音质量。

0 投票
1 回答
215 浏览

python - Azure 语音 SDK | 蟒蛇 | 实施关键字识别

我正在尝试使用 Azure 认知服务和 Python 创建自定义唤醒词。我正在关注快速入门教程 -

天蓝色快速入门

我已经使用语音工作室生成了关键字模型,现在我正在尝试在 Python 中实现它。快速入门有 C# 示例,其中使用 CognitiveServices.Speech、CognitiveServices.Speech.Audio。.NET 具有实现关键字识别的 KeywordRecognizer 类。

在 Python 中,没有 KeywordRecognizer 类,但是有一个Recognizer,它有 start_keyword_recognition 方法。

最初我使用它如下 -

当我执行它时,出现以下错误 -

AttributeError:“识别器”对象没有属性“_impl”

当我提到speech.py​​时,它具有以下关键字识别实现-

识别器类具有返回 _impl 的静态方法,但它使用 _from_config 方法,我无法在 Speech.py​​ 中找到该方法。

  1. 我们可以直接使用识别器类和 start_keyword_recognition 方法吗?
  2. 如果没有,请向我提供有关如何实现它的任何指示。

如果需要更多详细信息,请告诉我。