问题标签 [azure-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1195 浏览

google-cloud-platform - Speaker Diarizations vs Speaker Recognition google cloud vs microsoft azure vs ibm watson vs aws transcribe

我想做一个语音到文本分析的项目,我想 1)说话者识别 2)说话者分类 3)语音到文本。现在,我正在测试为 Microsoft、Google、AWS、IBM 等各种公司提供的各种 API,我可以在 Microsoft 中找到您可以选择用户注册和说话者识别 ( https://cognitivewuppe.portal.azure-api.net/ docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797)但是,所有其他平台都具有说话人分类功能,但没有说话人识别功能。在演讲者分类中,如果我理解正确,它将能够“区分”用户,但除非我不注册他们,否则它将如何识别?我只能找到 azure 中可用的注册选项

但我想确定一下,所以只想在这里检查一下,也许我正在查看正确的文档,或者也许有其他方法可以在 Google Cloud、Watson 和 AWS 转录中实现这一目标。如果是这样的话,你们可以帮我解决这个问题吗

0 投票
2 回答
689 浏览

python-requests - azure Speech to text rest api python 连接中止。操作系统错误 10054,WSAECONNRESET

我正在尝试测试 azure 语音以向其余 API 发送文本。首先,我使用了 POSTMAN 客户端,它运行良好。 邮递员的回应 现在我正在尝试使用 python 做同样的事情,但出现错误。我按照https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-speech-to-text#给出的说明进行操作

这是代码

下面是错误

0 投票
1 回答
120 浏览

azure - Microsoft Azure 语音 SDK - 禁用音频记录

我正在尝试使用 Microsoft Azure Speech to text 服务。我有一个使用 Python 快速入门的工作示例。但我想知道微软是否保存了音频文件,以及是否有选择退出它?任何想法将不胜感激。

我确实在 Speech SDk Azure 语音 SpeechServiceConnection_EnableAudioLogging 中找到了这个属性——但我不确定如何使用它。

0 投票
2 回答
666 浏览

azure - 如何为 MS Azure Speech to Text 服务启用字级置信度

如何使用 MS Azure 语音转文本服务获得每个单词的单词级别置信度?目前,我正在获得句子级别的置信度值,并且我需要单词级别的置信度以进行进一步处理。

0 投票
1 回答
32 浏览

azure-speech - 多语言语音翻译

Azure 认知服务能否协助将 1 个音频剪辑中的多种语言(例如日语、中文和西班牙语)翻译成文本形式的英语。是否可以对单个文件进行多翻译?

0 投票
2 回答
188 浏览

azure - Azure 语音:免费计划的使用情况报告 (F0)

我使用 F0 计划(免费层)在 Azure 上部署了语音资源(认知服务)。免费套餐每月最多提供 5 小时。如何查看当前使用情况,让我知道本月已经使用了多少分钟/小时?

0 投票
1 回答
108 浏览

c# - 树莓派上的 Azure 语音 SDK

有没有办法使用 Linux 或 Windows IoT 在树莓派(ARM 或 ARM64)上使用带有 C# 的语音 SDK?最好是 .NET Core。谢谢。

0 投票
1 回答
115 浏览

.net-core - 部署在本地服务结构上的 dotnet 核心应用程序引发 Microsoft 语音服务异常

我有一个使用 Microsoft 认知语音服务版本 1.8.0 的 dotnet core 2.2 应用程序。该应用程序部署在单节点本地服务结构集群上。

我已经使用 Visual Studio 2019 添加了服务结构支持 右键单击​​根项目 -> 添加 -> Container Orchestrator Support -> Service Fabric

成功部署后,当我点击控制器 API 时,出现以下异常

我可以在 dotnet core 应用程序中看到 docker publish 文件夹。Publish 文件夹具有包含本机 Microsoft.CognitiveServices.Speech.core.dll 和 Microsoft.CognitiveServices.Speech.extension.kws.dll的 win-x86 和 win-x64 运行时

0 投票
1 回答
559 浏览

c# - Ubuntu MATE ARM32 上的 Azure 语音 SDK 意图识别错误

我正在尝试使用 Ubuntu MATE ARM32(在 Raspberry Pi 上)上的 Speech SDK 进行基本的意图识别。文档说版本 1.11 应该可以工作,但我收到以下错误:

我正在使用 C# 和 .Net Core 3.1,并且我在 Pi 中插入了一个网络摄像头,我将其设置为通过 GUI 输入的默认音频。Ubuntu 版本是 18.04。

0 投票
1 回答
70 浏览

azure - 训练马拉地语的基线模型失败

我正在尝试训练马拉地语基线模型 20191009,但它失败并出现错误“无法训练模型马拉地语数据 4。错误:所选模型对在线插值无效..”

错误截图