speech-to-text - Microsoft Azure 的语音转文本识别服务支持的自定义语法？

Question

我有以下 2 个查询：

我们集成了微软提供的 C++ SDK 来使用这些服务。我试图找到支持的语法类型，但只能找到名为 PhraseListGrammars 的东西（https://docs.microsoft.com/en-us/python/api/azure-cognitiveservices-speech/azure.cognitiveservices.speech .phraselistgrammar?view=azure-python）。

如果您知道微软的云 STT 服务对此类自定义语法的支持程度，请帮助我们。

谢谢

score 0 · Accepted Answer

@aman bhardwaj 对于上述情况，不支持选项 VXML 和编译的二进制文件。可用于自定义或改进语法的选项是使用自定义语音到文本选项。这允许用户上传测试数据集以训练自定义模型以识别否则无法识别的格式。

例如：特定缩写的口语形式。

这个缩写 IEEE 的口语形式是“i Triple e”，标准语音到文本响应无法识别，可以使用发音文件训练自定义模型以识别口语形式并显示正确的文本。这些自定义场景大部分适用于使用自定义术语的行业，云 STT API 应该能够为所提供的语音输入提供正确的语法响应。

1 回答 1