我正在玩来自 facebook (huggingface) https://huggingface.co/facebook/rag-token-nq#usage的 RAG 示例。
代码很简单,但是这一步下载的数据集有点大(75GB):
retriever = RagRetriever.from_pretrained("facebook/rag-token-nq", index_name="exact", use_dummy_dataset=True)
它将数据集下载到 中/root/.cache/huggingface/datasets/
,如果可能的话,我想更改一些内容。这是那行代码的输出是:
Downloading and preparing dataset wiki_dpr/psgs_w100.nq.no_index (download: Unknown size, generated: Unknown size, post-processed: Unknown size, total: Unknown size) to /root/.cache/huggingface/datasets/wiki_dpr/
我的问题是:如何将文件夹更改为将 RagRetriever.from_pretrained (75GB 的)使用的数据集下载到另一个不同的文件夹root/.cache/huggingface/datasets/ .
谢谢!。