2

尝试在 Colab 中使用 pytorch torch.datasets.ImageFolder 加载训练数据。

transform = transforms.Compose([transforms.Resize(400),
                                transforms.ToTensor()])
dataset_path = 'ss/'
dataset = datasets.ImageFolder(root=dataset_path, transform=transform)
dataloader = torch.utils.data.DataLoader(dataset, batch_size=20)

我遇到了以下错误:

---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
<ipython-input-27-7abcc1f434b1> in <module>()
      2                                 transforms.ToTensor()])
      3 dataset_path = 'ss/'
----> 4 dataset = datasets.ImageFolder(root=dataset_path, transform=transform)
      5 dataloader = torch.utils.data.DataLoader(dataset, batch_size=20)

3 frames
/usr/local/lib/python3.7/dist-packages/torchvision/datasets/folder.py in make_dataset(directory, class_to_idx, extensions, is_valid_file)
    100         if extensions is not None:
    101             msg += f"Supported extensions are: {', '.join(extensions)}"
--> 102         raise FileNotFoundError(msg)
    103 
    104     return instances

FileNotFoundError: Found no valid file for the classes .ipynb_checkpoints. Supported extensions are: .jpg, .jpeg, .png, .ppm, .bmp, .pgm, .tif, .tiff, .webp

我的数据集文件夹包含一个子文件夹,其中包含许多 png 格式的训练图像,但 ImageFolder 仍然无法访问它们。

4

4 回答 4

4

我在使用类似 IPython notebook 的工具时遇到了同样的问题。

首先请检查您的dataset_path. ls -a如果您在 Linux 环境下使用。

发生在我身上的情况是我发现了一个名为的隐藏文件.ipynb_checkpoints,它与图像类子文件夹平行放置。我认为该文件会对 PyTorch 数据集造成混淆。我确定它没有用,所以我只是删除了它。然后数据集工作正常。

或者,如果您想简单地忽略该文件,您也可以试试这个.

于 2021-07-21T18:20:37.480 回答
1

图像文件夹中的文件需要放在每个类的子文件夹中,如下所示:

root/dog/xxx.png
root/dog/xxy.png
root/dog/[...]/xxz.png

root/cat/123.png
root/cat/nsdf3.png
root/cat/[...]/asd932_.png

https://pytorch.org/vision/stable/datasets.html#torchvision.datasets.ImageFolder

您在ssdir 中的文件是否以这种方式组织?

于 2021-07-02T22:27:28.147 回答
0

google colaboratory 的解决方案:
当你创建一个目录时,coollaboratory 会在里面额外创建 .ipynb_checkpoints。
要解决此问题,只需将其从包含图像目录的文件夹中删除(即从 train 文件夹中删除)即可。你需要运行:

!rm -R test/train/.ipynb_checkpoints
!ls test/train/ -a   #to make sure that the deletion has occurred

test/train/我的数据集文件夹路径在哪里

于 2022-01-12T05:45:01.653 回答
0

1-图像文件夹中的文件需要放在每个类的子文件夹中(如 Sergii Dymchenko 所说)

2-使用google colab时放置绝对路径

于 2021-11-01T13:13:22.537 回答