我在一个团队中使用 dvc 和 git 来版本控制数据文件。我们使用的是 dvc 1.3.1,带有一个 S3 存储桶遥控器。在执行dvc fetch
或dvc pull
在同事的分支上时出现此错误:
ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']
当我检查 dvc 文件中是否存在我没有问题的缓存文件时,我看到:
md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
path: completion_header.p
cache: true
metric: false
persist: false
但有问题的文件只有这个:
outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
size: 112007
nfiles: 3
path: processed_data
在所有情况下,文件都使用命令添加到 dvc dvc add %dirname%
。这是我第二次在同事的分支机构(2 个不同的人)上看到这个。
自发布以来,我意识到我的同事 dvc'd 了一个目录。我尝试先创建目录,然后调用dvc fetch
,但得到相同的错误。