因此,我正在尝试将数据集上传到 Microsoft 认知服务语音门户以获取自定义模型。
我已经这样做了大约一年没有问题,但是现在我得到了“失败”的详细信息“上传数据失败。请检查您的数据格式并尝试再次上传。” ... 很有用。
除了我已经检查过的以下内容之外,有谁知道可能导致该问题的原因。
文件大小为 1.3GB(压缩)/1.8GB(解压缩),低于https://docs.microsoft.com/en-us/azure/cognitive中指定的“数据导入的最大声学数据集文件大小”的 2GB 限制-services/speech-service/speech-services-quotas-and-limits#model-customization
Trans.txt 文件是格式正确的 1.3MB UTF-8 文件,带有一个 BOM 文本文件,其中包含https://docs.microsoft.com/en-us/azure/cognitive-services/speech中指定的制表符分隔的文件名/文本值-service/how-to-custom-speech-test-and-train
Trans.txt 文件中的所有条目都存在于目录中
目录中的所有文件在 Trans.txt 文件中都有一个关联条目
所有文件都是指定格式的 WAV 文件。
基本上以上所有方法都已经工作了一年,唯一真正改变的是 zip 文件的大小仍然低于限制。
如果 MS 的某个人看到这个,数据集 ID 是:7a3f240c-5eb7-4942-8e0f-7efa1b808eee