2

我正在尝试从头开始在 Tensorflow-Keras 中实现 YOLO v3,目的是在自定义数据集上训练我自己的模型。我的意思是不使用预训练的 weights。我浏览了 YOLOv1、YOLOv2(YOLO9000) 和 YOLOv3 的所有三篇论文,发现虽然 Darknet53 被用作 YOLOv3 的特征提取器,但我无法指出之后扩展的完整架构——“检测”层说到这里。在阅读了大量来自 Medium、kdnuggets 和其他类似网站的博客文章后,我最终提出了一些重要的问题:

  • 我是否错过了 YOLOv3 论文中检测层的完整架构(在用于特征提取的 Darknet53 之后扩展)?
  • 作者似乎在不同的训练阶段使用了不同的图像尺寸。网络是否会自动对图像进行放大/缩小?
  • 对于图像的预处理,调整它们的大小然后对其进行归一化(除以 255)真的就足够了吗?

请善意地指出我正确的方向。感谢您的帮助!

4

0 回答 0