假设我在 git/dvc 存储库中工作。有一个文件夹data
包含 100k 个小文件。根据文档的建议,我将 DVC 作为单个元素进行跟踪:
dvc add data
而且因为根据我的经验,DVC 在逐个跟踪这么多文件时有点慢。
我将 repo 克隆到另一个工作区,现在我在data.dvc
本地拥有该文件,但内部还没有任何实际文件。我想在文件夹中添加一个名为newfile.txt
的data
文件并使用 DVC 跟踪它。有没有办法做到这一点而不拉动data
本地的全部内容?
我现在尝试过的:
再次添加
data
文件夹:mkdir data mv path/to/newfile.txt data/newfile.txt dvc add data
该
data.dvc
文件是从data
仅包含的本地状态再次构建的,newfile.txt
因此这不起作用。将文件添加为文件夹中的单个元素
data
:dvc add data/newfile.txt
我得到:
Cannot add 'data/newfile.txt', because it is overlapping with other DVC tracked output: 'data'. To include 'data/newfile.txt' in 'data', run 'dvc commit data.dvc'
按照建议使用 dvc commit
mkdir data mv path/to/newfile.txt data/newfile.txt dvc commit data.dvc
与 1. 类似,
data.dvc
从 的本地状态再次重建data
。