python-3.x - 使用 PyTorch 直接将数据加载到 GPU 中

Question

在训练循环中，我将一批数据加载到 CPU 中，然后将其传输到 GPU：

import torch.utils as utils

train_loader = utils.data.DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=4, pin_memory=True)

for inputs, labels in train_loader:
    inputs, labels = inputs.to(device), labels.to(device)

这种加载数据的方式非常耗时。有什么方法可以直接将数据加载到 GPU 中而无需传输步骤？

score 3 · Accepted Answer

@PeterJulian 首先感谢您的回复。据我所知，没有将整个数据集加载到 GPU 的单行命令。实际上，在我的回复中，我的意思是__init__ 在数据加载器中使用 .to(device) 。我之前分享的链接中有一些示例。另外，我在下面留下了一个示例数据加载器代码。希望链接中的示例和下面的代码都有帮助。

class SampleDataset(Dataset):
    def __init__(self, device='cuda'):
        super(SampleDataset, self).__init__()
        self.data = torch.ones(1000)
        self.data = self.data.to(device)
    
    def __len__(self):
        return len(self.data)

    def __getitem__(self, i):
        element = self.data[i]
        return element

score 1 · Accepted Answer

您可以将所有数据加载到张量中，而不是将其移动到 GPU 内存中。（假设您有足够的内存）当您需要它时，请使用已经在 GPU 内存中的张量内的数据。希望能帮助到你。

python-3.x - 使用 PyTorch 直接将数据加载到 GPU 中

2 回答 2

Related

Reference