大约一个月前,我使用 TensorFlowGPU 1.13 在 Google Colab Pro 上使用 ImageAI 训练了一个自定义对象检测模型,训练时间约为 30 分钟/epoch。现在,当我使用相同的数据集但使用 TensorFlowGPU 2.4.3(ImageAI 不再支持旧的 TF)进行训练时,我得到的 GPU 使用率非常低(0.1GB),每个 epoch 的训练时间为 6 小时。我尝试在本地机器上训练相同的模型,但训练时间也很慢。
我正在使用以下导入(基于 ImageAI 文档):
!pip install tensorflow-gpu==2.4.0 keras==2.4.3 numpy==1.19.3 pillow==7.0.0 scipy==1.4.1 h5py==2.10.0 matplotlib==3.3.2 opencv-python keras-resnet==0.2.0
!pip install imageai --upgrade
我正在从 Google Drive 中提取我的训练数据。
有什么我可能会遗漏的东西可以加快我在 Google Colab 或我的本地机器上的对象检测训练时间吗?缓慢的训练时间正在减慢我的研究速度。