2

我在一个团队中使用 dvc 和 git 来版本控制数据文件。我们使用的是 dvc 1.3.1,带有一个 S3 存储桶遥控器。在执行dvc fetchdvc pull在同事的分支上时出现此错误:

ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']

当我检查 dvc 文件中是否存在我没​​有问题的缓存文件时,我看到:

md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
  path: completion_header.p
  cache: true
  metric: false
  persist: false

但有问题的文件只有这个:

outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
  size: 112007
  nfiles: 3
  path: processed_data

在所有情况下,文件都使用命令添加到 dvc dvc add %dirname%。这是我第二次在同事的分支机构(2 个不同的人)上看到这个。

自发布以来,我意识到我的同事 dvc'd 了一个目录。我尝试先创建目录,然后调用dvc fetch,但得到相同的错误。

4

1 回答 1

2

在所有情况下,文件都使用命令 dvc add %filename% 添加到 dvc。

似乎很有可能其中一个 dvc 文件是在较新版本的 dvc 中创建的,而您正在尝试使用旧版本进行操作。在添加新文件时,您的所有同事是否都使用相同的 dvc 版本?

于 2021-04-16T09:48:37.710 回答