我对 Yolo 的工作方式有点困惑。在论文中,他们说:
“置信度预测代表了预测框和任何地面实况框之间的 IOU。”
但是我们如何拥有基本事实框呢?假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?
对不起,如果问题很简单,但我真的不明白这部分......谢谢!
我对 Yolo 的工作方式有点困惑。在论文中,他们说:
“置信度预测代表了预测框和任何地面实况框之间的 IOU。”
但是我们如何拥有基本事实框呢?假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?
对不起,如果问题很简单,但我真的不明白这部分......谢谢!
但是我们如何拥有基本事实框呢?
您似乎对什么是训练数据以及 YOLO 的输出或预测感到困惑。
训练数据是一个边界框以及类标签。这被称为“ground truth box”,b = [bx, by, bh, bw, class_name (or number)]
其中bx, by
是带注释的边界框的中点,是框bh, bw
的高度和宽度。
输出或预测是图像的边界框b
和类。形式上:注释边界框的中点在哪里。是盒子的高度和宽度,并且-在 'box'中有类的概率。c
i
y = [ pl, bx, by, bh, bw, cn ]
bx, by
bh, bw
pc
c
b
假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?
当你说你有一个预训练的模型(你指的是已经训练过的模型)时,你的网络已经“知道”某些对象类的边界框,它会尝试估计对象在新图像中的位置,但这样做时你的网络可能会在其他地方预测边界框而不是它应该的位置。那么,您如何计算“其他地方”的盒子有多少?借条救命!IOU(Intersection Over Union)所做的是,它会为您提供重叠区域超过联合区域的分数。
IOU = Area of Overlap / Area of Union
虽然它很少是完美的或 1。它有点接近,IOU 的值越小,YOLO 参考地面实况预测边界框越差。IOU 分数为 1 表示边界框参考地面实况被准确或非常自信地预测。
我想我知道答案 Guess YOLO 在 2 种情况下使用 IoU 来实现不同的目标 1- 在训练时评估预测 2- 当您使用已经训练过的模型时,有时您会为同一个对象获得许多框。我有红,这是 YOLO 解决这个问题的方式(不确定这是否是非最大抑制的一部分)