问题标签 [azure-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - Speaker Diarizations vs Speaker Recognition google cloud vs microsoft azure vs ibm watson vs aws transcribe
我想做一个语音到文本分析的项目,我想 1)说话者识别 2)说话者分类 3)语音到文本。现在,我正在测试为 Microsoft、Google、AWS、IBM 等各种公司提供的各种 API,我可以在 Microsoft 中找到您可以选择用户注册和说话者识别 ( https://cognitivewuppe.portal.azure-api.net/ docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797)但是,所有其他平台都具有说话人分类功能,但没有说话人识别功能。在演讲者分类中,如果我理解正确,它将能够“区分”用户,但除非我不注册他们,否则它将如何识别?我只能找到 azure 中可用的注册选项
但我想确定一下,所以只想在这里检查一下,也许我正在查看正确的文档,或者也许有其他方法可以在 Google Cloud、Watson 和 AWS 转录中实现这一目标。如果是这样的话,你们可以帮我解决这个问题吗
python-requests - azure Speech to text rest api python 连接中止。操作系统错误 10054,WSAECONNRESET
我正在尝试测试 azure 语音以向其余 API 发送文本。首先,我使用了 POSTMAN 客户端,它运行良好。
现在我正在尝试使用 python 做同样的事情,但出现错误。我按照https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-speech-to-text#给出的说明进行操作
这是代码
下面是错误
azure - Microsoft Azure 语音 SDK - 禁用音频记录
我正在尝试使用 Microsoft Azure Speech to text 服务。我有一个使用 Python 快速入门的工作示例。但我想知道微软是否保存了音频文件,以及是否有选择退出它?任何想法将不胜感激。
我确实在 Speech SDk Azure 语音 SpeechServiceConnection_EnableAudioLogging 中找到了这个属性——但我不确定如何使用它。
azure - 如何为 MS Azure Speech to Text 服务启用字级置信度
如何使用 MS Azure 语音转文本服务获得每个单词的单词级别置信度?目前,我正在获得句子级别的置信度值,并且我需要单词级别的置信度以进行进一步处理。
azure-speech - 多语言语音翻译
Azure 认知服务能否协助将 1 个音频剪辑中的多种语言(例如日语、中文和西班牙语)翻译成文本形式的英语。是否可以对单个文件进行多翻译?
azure - Azure 语音:免费计划的使用情况报告 (F0)
我使用 F0 计划(免费层)在 Azure 上部署了语音资源(认知服务)。免费套餐每月最多提供 5 小时。如何查看当前使用情况,让我知道本月已经使用了多少分钟/小时?
c# - 树莓派上的 Azure 语音 SDK
有没有办法使用 Linux 或 Windows IoT 在树莓派(ARM 或 ARM64)上使用带有 C# 的语音 SDK?最好是 .NET Core。谢谢。
.net-core - 部署在本地服务结构上的 dotnet 核心应用程序引发 Microsoft 语音服务异常
我有一个使用 Microsoft 认知语音服务版本 1.8.0 的 dotnet core 2.2 应用程序。该应用程序部署在单节点本地服务结构集群上。
我已经使用 Visual Studio 2019 添加了服务结构支持 右键单击根项目 -> 添加 -> Container Orchestrator Support -> Service Fabric
成功部署后,当我点击控制器 API 时,出现以下异常
我可以在 dotnet core 应用程序中看到 docker publish 文件夹。Publish 文件夹具有包含本机 Microsoft.CognitiveServices.Speech.core.dll 和 Microsoft.CognitiveServices.Speech.extension.kws.dll的 win-x86 和 win-x64 运行时。
c# - Ubuntu MATE ARM32 上的 Azure 语音 SDK 意图识别错误
我正在尝试使用 Ubuntu MATE ARM32(在 Raspberry Pi 上)上的 Speech SDK 进行基本的意图识别。文档说版本 1.11 应该可以工作,但我收到以下错误:
我正在使用 C# 和 .Net Core 3.1,并且我在 Pi 中插入了一个网络摄像头,我将其设置为通过 GUI 输入的默认音频。Ubuntu 版本是 18.04。