问题标签 [azure-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
147 浏览

python - 与 AWS Lambda 一起使用时出现 azure-cognitiveservices-speech api 错误

我正在尝试在 AWS Lambda 中使用 Microsoft 语音到文本 api(azure-cognitiveservices-speech)。在 AWS Lambda 中,我使用的是 docker image(public.ecr.aws/lambda/python:3.8)。当我运行代码时,出现以下错误:

我尝试按照https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-sdk?tabs=linux%2Crhel-centos%2Cios-xcode%2Cmac-xcode解决问题%2Candroid-studio#get-the-speech-sdk 但仍然遇到同样的错误

0 投票
1 回答
38 浏览

python-3.x - 我在哪里可以获得用于为 azure Speech to Text 服务创建 webhook 的秘密属性

如果您查看属性键,秘密值是SecretUsedToCreateHMACHexDigestThatYouWillFindIn 我从哪里得到这个值?

0 投票
1 回答
76 浏览

node.js - Microsoft Azure Cognitive Speech to Text - 返回未定义的 API 错误

目前我正在使用创建一个 STT 应用程序

  • NodeJS v16.x
  • microsoft-cognitiveservices-speech-sdk v1.17.0

我在该地区创建了一个 azure Speech Cognitive 资源westeurope并验证了密钥是否正确。

现在我正在使用以下代码来执行语音识别:

然后识别器将只记录一个带有消息的事件Unable to contact server. StatusCode: 1006, undefined Reason: Unsupported type: object at: (shallow)。我根据 azure 文档创建了一个语音服务,并按照 Azure 门户中的示例实现中的定义实现了此代码。

遗憾的是,此错误消息对我没有太大帮助,我也无法在 Azure 知识库中找到任何内容。

其他人有同样的问题吗?

0 投票
1 回答
45 浏览

azure - 使用 Azure 为 3 位以上的演讲者进行演讲者分类

Azure 的批量转录是否支持超过 2 个发言者的发言者分类?

我检查了他们的Rest API文档,没有发现任何相关的东西。

是否有其他方法可以使用 Azure 认知服务来做到这一点?

0 投票
1 回答
20 浏览

speech-to-text - 每种语言的 Azure 语音听写单词列表

在听写模式打开的 Azure 中使用语音转文本时,它会识别“问号”之类的单词并返回“?”。我们找到了类似这样的其他词并正在寻找完整的列表,但无法在文档中找到它(https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/index-speech - 到文本

0 投票
0 回答
19 浏览

laravel - Azures 语音到文本 webhook 标头 X-MicrosoftSpeechServices-Signature 算法?

我正在尝试在 php 中实现一个身份验证中间件,用于 azures 语音到文本 api 的 webhook 回调。

我想为此使用 X-MicrosoftSpeechServices-Signature 标头。文档指出,这是有效载荷的 sha256 加密值,其密钥为密钥。

假设 webhook 发回如下请求:

标题就像(秘密是:aBdneoSDSDjw34dfsd2)

所以,根据文档,我可以用我的秘密加密 sha256 中的有效负载,并且应该得到相同的签名,对吧?

不幸的是,这些值不匹配。由于签名看起来像是另外进行了 base64 编码,所以我也尝试过:

而且至少字符长度是一样的,但还是不匹配。我在这里想念什么?

0 投票
1 回答
23 浏览

azure - Azure 语音到文本批量转录随机冻结/需要很长时间

有时,Azure 认知语音到文本服务的批量转录需要非常长的时间。

我现在有好几次了,即使只包含一个指向 blob 存储上的短(约 1 分钟)音频文件的单个 URL,转录也需要几个小时(!)来转录。通常这只需要半分钟,但在大约 5-10% 的情况下,该过程会卡住。

没有任何错误、警告或警报......而且转录总是成功完成,所以这不是由于音频文件。有时只需要5-10个小时。我在我的 webhook 上收到了“TranscriptionCreation”事件,因此该过程也肯定会开始。

我不知道,当时可能没有足够的可用资源并为以后安排进程,这可能取决于天蓝色。但这似乎根本不“正常”。

是否有一些优先级参数?它是认知服务的错误吗?我能做些什么呢?

0 投票
0 回答
401 浏览

c# - Microsoft Azure 语音识别流即将关闭

我正在尝试实现用户麦克风的生命流翻译。用户将使用 Chrome 或 Edge。

浏览器将每 500 毫秒发布一次用户输入。不会丢失任何信息。

在服务器级别,我基本上创建PushAudioInputStream

并将帖子的正文写入流中。

在第一篇文章之后,我让下面的并行方法运行(基本上直到用户离开)

在第一次发布之后,此代码立即调用 .Canceled() 并返回。给定的原因是EndOfStream。但我从不 .close() 流或类似的东西......