在训练循环中,我将一批数据加载到 CPU 中,然后将其传输到 GPU:
import torch.utils as utils
train_loader = utils.data.DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=4, pin_memory=True)
for inputs, labels in train_loader:
inputs, labels = inputs.to(device), labels.to(device)
这种加载数据的方式非常耗时。有什么方法可以直接将数据加载到 GPU 中而无需传输步骤?