yolo 白皮书
分享
YOLO系列进阶实操教程【ultralytics && OBB tasks】
输入“/”快速插入内容
YOLO系列进阶实操教程【ultralytics && OBB tasks】
飞书用户8611
飞书用户3472
飞书用户5879
7月7日修改
🎼
YoLo Master项目
•
白皮书链接
YOLO Master白皮书规划
•
github链接
https://github.com/datawhalechina/yolo-master/
本章通过
DOTAv1
样例数据集
演示如何在
ultralytics
项目中,实现
yolo11-n OBB
模型
的
训练及推理
,来帮助学习者通过实操掌握对yolo系列模型的进阶操作
【尝试进行了默认参数进行参数调优,并比较了V8V11两个不同模型在不同配置下的表现】
。文档配套代码
链接
。
入门实操教程
请查看
YOLO系列入门实操教程【ultralytics YOLOv8m】
飞书用户8611
飞书用户3472
GitHub
【Stanford Dogs Dataset basic tutorial with YOLOv8m】快速上手基于ultralytics YOLOv8m,并完成一个狗品种检测的实战项目。数据集来源于
Stanford Dogs Dataset
本文Reviewers:
飞书用户5879
飞书用户8611
前言
本文和实验中
采用的数据集为
下采样
的
DOTAv1
,模型采用
yolo11
-obb
,实现
旋转目标
(Oriented Bounding Box, OBB)
检测
。
这里的下采样指挑选其中完整数据集中的一部分图片进行构建进行实验测试的小型数据集
yolo11的模型结构和改进请参考
文档
先来了解
DOTAv1数据集
和
OBB任务
。
1.
旋转目标检测数据集
DOTAv1
(DOTA: A Large-scale Dataset for Object Detection in Aerial Images)是一个用于航空图像目标检测的大规模数据集,广泛应用于遥感图像分析和计算机视觉任务。
主要特点包括:
◦
图像分辨率:高分辨率(图像尺寸从 800x800 到 4000x4000 不等)。
◦
目标类别:15 个类别,涵盖多种常见的地面目标。
◦
目标数量:超过 180,000 个标注实例。
◦
标注格式:旋转矩形框(Rotated Bounding Box),适用于目标在图像中任意方向的情况。
2.
OBB相对于传统矩形框可以更精准的定位目标区域,在工业质检、遥感、自动驾驶等领域有广泛应用。
例如下图中的船只,若采用矩形框标注,将得到大量的背景区域,而旋转边界框可以很好的包裹目标。
1.
YOLO相关仓库介绍
YOLO自v3版本以来,得到了广泛应用,
对YOLO代码实现的项目如雨后春笋,这里在Github上检索'YOLO',并对stars排名前9的仓库进行分析
,具体数据如下:
通过分析可发现,Ultralytics的仓库占三分之一,框架型的仓库有mmlab的mmdetection, 有其他上榜的包括v7/v9/v10/YOLOX四个单独项目。
对于YOLO的代码可分为单个项目和框架型项目。
•
单个项目,主要是某个针对特定的版本编写的仓库,主要来自首发团队,例如上述的v3/v5/v7/v9/v10/YOLOX。
特别说明的是,
YOLOv8和11是首发于ultralytics/ultralytics仓库中
,因此似乎看不到其名称。这是由于ultralytics公司的定位所至。
•
框架型仓库,主要是由成熟团队开源维护,仓库中除单个模型外,提供了丰富的组件和功能。例如ultralytics和mmdetection。
通过开源仓库统计分析,可了解ultralytics公司所开源的仓库受众最广,本章的实操也将针对ultralytics/ultralytics进行。
ultralytics的优点
为什么选ultralytics?
这里梳理几个
ultralytics的优点
1.
团队强大:开源团队来自专注CV领域的公司ultralytics,该公司先后提出了v5、v8、11
2.
功能强大:目前已经涵盖v3-11所有YOLO模型,并提供分类、分割、目标跟踪等其他功能
3.
更新及时:仓库持续保持更新,功能不断完善
4.
文档丰富:该仓库的文档丰富,适合零基础入门