YOLO不死！YOLOv9出炉：性能速度SOTA——_yolo cpu

频道：科技数码日期：2024-05-27 14:15:12 浏览：2497

如何学习yolo?

首先，YOLOv3通过引入深基底backbone——darknet-53和轻量级版本tiny darknet，兼顾了速度与精度。这一设计使得模型既能捕捉深层次的特征，又能保持高效的实时性能。而告别softmax，采用二分类交叉损失函数，使得模型在预测过程中更加精确，特别是在目标分类上。

学习YOLO的方法可以分为以下几个步骤：了解YOLO网络架构：学习YOLO的基本原理，包括其输入输出结构，以及如何通过卷积神经网络（CNN）实现端到端的目标检测。理解训练样本构建方法：学习如何为YOLO模型准备训练数据，包括如何标注边界框（bounding boxes）和类别标签。

Yolov5的输入端：Mosaic增强增强了对小目标的敏感性，自适应锚框则提升了检测精度（输入端改进）。2 Yolov5l适合大目标快速检测，而其他模型在精度提升的同时，速度可能会有所下降（性能权衡）。独特算法特点 Yolov5的初始锚框自适应计算，允许用户根据需要调整（初始锚框自适应）。

从上到下我们走一遍YOLOV3流程。A位置，当图像输入进来以后，图像的尺寸并不是正方形的，为了后面的计算方便，我们首先把他转换成能被32整除的正方形。为什么是32，整个网络要经过16次放缩变换（步长为2的卷积操作{替代池化}），最后得到的特征图尺寸是11*11 或者12*12或者14*14这样的方格。

yolo算法是一种目标检测算法。目标检测任务的目标是找到图像中的所有感兴趣区域，并确定这些区域的位置和类别概率。目标检测领域的深度学习方法主要分为两大类两阶段式（Two-stage）目标检测算法和单阶段式（One-stage）目标检测算法。

首先将输入图片resize到448x448，然后送入CNN网络，最后处理网络预测结果得到检测的目标。相比R-CNN算法，其是一个统一的框架，其速度更快，而且Yolo的训练过程也是end-to-end的。相关信息：Yolo采用卷积网络来提取特征，然后使用全连接层来得到预测值。

关于YOLOv3的一些细节

1、YOLOv3使用k-means聚类确定边界框先验，选择了9个集群和3个尺度，并在整个尺度上均匀分割集群。在COCO数据集上，9个集群分别为(10×13)、(16×30)、(33×23)、(30×61)、(62×45)、(59×119)、(116×90)、(156×198)、(373×326)。

2、那是因为在YOLOv3中，作者将置信度和条件类别概率放到了每个bounding box中，即每个bounding box都有一对置信度和条件类别概率，而v1中所有的bounding box共用一个条件类别概率，上文中在说明输出的各个参数时，默认解释的是v3的输出格式，关于v1的细节不再赘述。

3、YOLO层是一个预测值和Lables目标值相减求损失的层。

4、YOLO3更进一步采用了3个不同尺度的特征图来进行对象检测。能够检测的到更加细粒度的特征。对于这三种检测的结果并不是同样的东西，这里的粗略理解是不同给的尺度检测不同大小的物体。

5、YOLOv3借鉴了YOLOv1和YOLOv2，虽然没有太多的创新点，但在保持YOLO家族速度的优势的同时，提升了检测精度，尤其对于小物体的检测能力。YOLOv3算法使用一个单独神经网络作用在图像上，将图像划分多个区域并且预测边界框和每个区域的概率。

6、一种可能的策略是构建一个多任务网络结构。首先，使用yolov3对摔倒行为进行检测，同时在单独的分支上训练人脸识别模型。在最后的全连接层，可以采用concatenate或加权平均的方式将两个分支的输出融合。然而，这种做法的有效性存疑，因为人脸识别信息对于判断摔倒的关联度可能并不直接。

YOLOv1-YOLOv5+YOLOv7细节详解与总结

YOLO算法：从V1到V7的细节解析与比较YOLO系列算法以其高效性和实时性在物体检测领域占据重要地位。YOLO的核心评价指标围绕IOU（Intersection over Union，交并比）展开，它衡量预测框与真实框的重合程度。当IOU超过阈值，预测被认为是正确的。

YOLOv1的基本思想 YOLO的核心思想是将目标边框定位问题转化为回归问题，利用整张图作为网络输入，直接在输出层回归bounding box的位置和bounding box所属的类别。YOLO将输入图像分成SxS个格子，如果某个物体的Ground truth的中心位置的坐标落入到某个格子，那么这个格子就负责检测出这个物体。

Yolo算法很好的解决了这个问题，它不再是窗口滑动了，而是直接将原始图片分割成互不重合的小方块，然后通过卷积最后生产这样大小的特征图，基于上面的分析，可以认为特征图的每个元素也是对应原始图片的一个小方块，然后用每个元素来可以预测那些中心点在该小方格内的目标，这就是Yolo算法的朴素思想。

Neck是YOLOv5的关键连接点，它通过UpSample和下采样技术，将backbone的浅层和深层特征无缝融合，形成特征金字塔，确保信息的完整性和多样性。 Head部分由三个1*1卷积层组成，它们接收来自Neck的特征图，通过调整通道数和尺寸，将网格和anchor信息进行精准处理。

网络结构探索 Yolov5的网络结构不同于过往，特别是Yolov5s，它的深度与宽度最小，但效率极高。利用netron工具，您可以清晰地看到它的结构图，了解其中的巧妙设计（Yolov5s结构图）。2 网络结构对比 Yolov5m：网络结构可视化，对比Yolov5s，结构更加优化（网络结构可视化）。

这里，我们特别关注马赛克和混合增强的深入解析，通过Decoupled head的代码实践，让学习者体验到YOLOv4与YOLOv5之间的细微差别。YOLOX的出现则将我们带入了anchor-free的新时代，讲解内容围绕SimOTA和数据增强展开，展示了YOLO系列的持续进化。

关键词YOLO不死！YOLOv9出炉：性能速度SOTA——

[上一篇]小米14_小米14pro参数

[下一篇]苹果怎样迁移数据到新手机_iphone如何迁移数据到新iphone

YOLO不死！YOLOv9出炉：性能速度SOTA——_yolo cpu

如何学习yolo?

关于YOLOv3的一些细节

YOLOv1-YOLOv5+YOLOv7细节详解与总结

相关文章