deep-learning - 对约洛感到困惑

Question

我对 Yolo 的工作方式有点困惑。在论文中，他们说：

“置信度预测代表了预测框和任何地面实况框之间的 IOU。”

但是我们如何拥有基本事实框呢？假设我在未标记的图像上使用我的 Yolo 网络（已经训练过）。那我的信心是什么？

对不起，如果问题很简单，但我真的不明白这部分......谢谢！

score 3 · Accepted Answer

但是我们如何拥有基本事实框呢？

您似乎对什么是训练数据以及 YOLO 的输出或预测感到困惑。

训练数据是一个边界框以及类标签。这被称为“ground truth box”，b = [bx, by, bh, bw, class_name (or number)]其中bx, by是带注释的边界框的中点，是框bh, bw的高度和宽度。

输出或预测是图像的边界框b和类。形式上：注释边界框的中点在哪里。是盒子的高度和宽度，并且-在 'box'中有类的概率。ciy = [ pl, bx, by, bh, bw, cn ]bx, bybh, bwpccb

假设我在未标记的图像上使用我的 Yolo 网络（已经训练过）。那我的信心是什么？

当你说你有一个预训练的模型（你指的是已经训练过的模型）时，你的网络已经“知道”某些对象类的边界框，它会尝试估计对象在新图像中的位置，但这样做时你的网络可能会在其他地方预测边界框而不是它应该的位置。那么，您如何计算“其他地方”的盒子有多少？借条救命！IOU（Intersection Over Union）所做的是，它会为您提供重叠区域超过联合区域的分数。

IOU = Area of Overlap / Area of Union

虽然它很少是完美的或 1。它有点接近，IOU 的值越小，YOLO 参考地面实况预测边界框越差。IOU 分数为 1 表示边界框参考地面实况被准确或非常自信地预测。

score 0 · Accepted Answer

YOLO 使用 IOU 来衡量训练权重。当你搜索 IOU 是什么时，它就是这样。

所以在训练这个 IoU 分数时计算验证数据的预测。这意味着

(Prediction of object)*IoU score

希望它会帮助你。

score 0 · Accepted Answer

我认为你所需要的只是一张能阐明什么是基本事实的好形象。

正如您在左侧看到的那样，完美包围对象的矩形是基本事实（蓝色）。

橙色矩形是预测的矩形。IoU是您可以从图像的右侧直观地理解的内容。

希望这可以帮助。

score 0 · Accepted Answer

我想我知道答案 Guess YOLO 在 2 种情况下使用 IoU 来实现不同的目标 1- 在训练时评估预测 2- 当您使用已经训练过的模型时，有时您会为同一个对象获得许多框。我有红，这是 YOLO 解决这个问题的方式（不确定这是否是非最大抑制的一部分）

deep-learning - 对约洛感到困惑

4 回答 4

Related

Reference