问题标签 [azure-cognitive-services]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
484 浏览

azure-cognitive-services - Microsoft Face API - 从实时视频中查找相似的面孔

我正在开发使用 Microsoft Cognitive Services-Face API 检测用户面部并从实时实时流视频中找到相似面部的应用程序。我使用以下示例作为参考:

https://github.com/Microsoft/Cognitive-Samples-VideoFrameAnalysis/tree/master/Windows/LiveCameraSample

我能够从实时视频中检测人脸,但我不知道如何存储人脸图像以及如何从中检测相似的人脸。

任何人都可以帮忙找到路吗?

0 投票
1 回答
339 浏览

voice-recognition - 微软说话人识别算法

我一直在开发使用 Microsoft 的说话人识别 API 的应用程序,尤其是说话人识别。

是否有任何与 Microsoft Speaker Identification 的工作方式相关的论文或期刊?

谢谢你。

0 投票
1 回答
181 浏览

dataset - 如何将自定义语言数据集上传到 Azure 自定义语音服务?

该服务目前处于预览阶段,似乎与其文档不同步。

此处的文档显示了来自不同控制台的屏幕截图,与自定义语音服务的 Azure 门户页面完全不同。我检查的 Azure SDK 似乎根本没有任何自定义语音服务功能。

那么如何上传语言数据集来自定义词汇统计呢?

0 投票
1 回答
134 浏览

bing - Bing API v7 最小延迟服务器位置

您好,我最近从印度尝试了 Bing API v7,平均需要 1.5 秒,然后我从新加坡和伦敦尝试,平均为 1.1 秒,你能建议我优化技巧吗,我使用 curl php 7,也是最好的服务器的位置

0 投票
1 回答
241 浏览

speech-to-text - Bing Speech to Text API 返回非常错误的文本

我正在尝试音频文件中的“Bing Speech To Text API”,其中包含在呼叫中心回答客户的人与呼叫呼叫中心以解决他的疑问的客户之间的真实对话。因此,这些音频有两个人在说话,有时在客户等待支持人员的答复时有很长的静音期。这些音频有 5 到 10 分钟长。

我的疑问是:

使用 Microsoft 认知服务将此类音频翻译成文本的最佳方法是什么?

除了 Bing Speech To Text,我还必须使用哪些 API?

在将音频发送到 Bing Speech To Text 之前,我是否必须剪切或转换音频?

我之所以这么问,是因为 Bing Speech to text API 返回的文本与音频内容非常非常非常非常不同。这是不可能使用或理解的。但是,当然,我认为我做错了。

拜托,你能向我解释一下处理这样的音频文件的最佳策略吗?

我会很高兴得到任何帮助。最好的问候,

0 投票
2 回答
247 浏览

c# - Azure KeyPhrase API 有时返回 400

我使用 Azure KeyPhrase API 得到的结果好坏参半——有时成功(我的意思是 200 个结果),有时我得到 400 个错误请求。为了测试该服务,我将 Azure PDF 中的内容发送到他们的 NoSQL 服务上。

文档说每个文档最多可以有 5k 个字符。为了排除这种情况,(我从 5k 开始)我将每个字符限制为最多 1k 个字符。

我怎样才能获得有关失败原因的更多信息?我已经检查了门户网站,但那里没有太多细节。

我正在使用这个端点:https ://eastus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases

一些样本失败:

  • {"documents":[{"language":"en","id":1,"text":"David Chappell 了解 Microsoft Azure 上的 NoSQL 由 Microsoft Corporation 赞助 版权所有 © 2014 Chappell & Associates"}]}

  • 但是专门设计用于处理此类信息的存储技术可能更简单。已经创建了 NoSQL 技术来解决此类问题。顾名思义,标签涵盖了各种存储"}]}

** 添加了我的快速/脏 poc 代码 ***

调用者:

0 投票
0 回答
362 浏览

c# - FaceAPIException:使用 DetectAsync 方法时

我正在尝试使用 faceServiceClient 中的 DetectAsync 方法。

并且在 DetectAsync 方法中引发异常

Microsoft.ProjectOxford.Face.FaceAPIException:引发了“Microsoft.ProjectOxford.Face.FaceAPIException”类型的异常。在 Microsoft.ProjectOxford.Face.FaceServiceClient.d__672.MoveNext() --- 从先前引发异常的位置结束堆栈跟踪--- 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 在 System.Runtime。 CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) at Microsoft.ProjectOxford.Face.FaceServiceClient.d__29.MoveNext() --- 从先前抛出异常的位置结束堆栈跟踪---在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess (任务任务)在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(任务任务)在 System.Runtime.CompilerServices.TaskAwaiter1。

0 投票
1 回答
729 浏览

azure-cognitive-services - 使用自定义视觉预测 API

我尝试使用自定义视觉服务。

响应此错误消息:

{"代码":"BadRequestImageFormat","消息":""}

附上我的代码和测试的图像文件

请检查这个并帮助我

图片

我参考了这个文件。

https://southcentralus.dev.cognitive.microsoft.com/docs/services/57982f59b5964e36841e22dfbfe78fc1/operations/5a3044f608fa5e06b890f164

0 投票
1 回答
321 浏览

node.js - Node Js 微软认知服务

我在从 NodeJs 调用认知服务时遇到问题。我对 Node 很陌生,所以从直接的 JavaScript 到 Node 的转换一直是一个挑战。当我使用互联网上的图像时它可以工作,但我需要使用本地服务器上的图像并且尝试了很多方法来满足它作为原始二进制文件的要求。这是我一直在尝试的...

由于使用来自网络的图像时可以成功调用并且我不断收到的错误是:

有任何想法吗?我相信这与在体内传递原始二进制图像有关。每个模块 https://github.com/joshbalfour/node-cognitive-services

https://github.com/joshbalfour/node-cognitive-services/tree/v0.2.0#computer-vision---analyze-image

谢谢你的帮助

0 投票
1 回答
62 浏览

azure - Azure 认知服务文本 API TranslateArray 类别用法

TranslateArray 请求中的“类别”属性是预定义列表还是在请求期间打开以指定?

产生以下响应:

API 文档中的定义:

类别:包含翻译类别(域)的字符串。默认为一般

但是如果这不是自定义字段,还不清楚还有哪些其他类别?