1

因此,我正在尝试将数据集上传到 Microsoft 认知服务语音门户以获取自定义模型。

我已经这样做了大约一年没有问题,但是现在我得到了“失败”的详细信息“上传数据失败。请检查您的数据格式并尝试再次上传。” ... 很有用。

除了我已经检查过的以下内容之外,有谁知道可能导致该问题的原因。

  1. 文件大小为 1.3GB(压缩)/1.8GB(解压缩),低于https://docs.microsoft.com/en-us/azure/cognitive中指定的“数据导入的最大声学数据集文件大小”的 2GB 限制-services/speech-service/speech-services-quotas-and-limits#model-customization

  2. Trans.txt 文件是格式正确的 1.3MB UTF-8 文件,带有一个 BOM 文本文件,其中包含https://docs.microsoft.com/en-us/azure/cognitive-services/speech中指定的制表符分隔的文件名/文本值-service/how-to-custom-speech-test-and-train

  3. Trans.txt 文件中的所有条目都存在于目录中

  4. 目录中的所有文件在 Trans.txt 文件中都有一个关联条目

  5. 所有文件都是指定格式的 WAV 文件。

基本上以上所有方法都已经工作了一年,唯一真正改变的是 zip 文件的大小仍然低于限制。

如果 MS 的某个人看到这个,数据集 ID 是:7a3f240c-5eb7-4942-8e0f-7efa1b808eee

相关反馈帖子:https ://feedback.azure.com/forums/932041-azure-cognitive-services/suggestions/42375118-actionable-error-messaging-in-speech-portal

4

1 回答 1

0

联系 MS 支持后,尽管我们在限制范围内,但与文件大小相关的服务器端似乎出现了问题。他们正在努力修复它。

于 2021-01-15T11:22:19.883 回答