YOLO实践之通用数据集格式介绍与私有数据集制作@程宏 @刘伟鸿 @李欣桓

4月2日修改
本文讨论了计算机视觉任务和典型数据集,着重介绍VOC和COCO数据集,还涉及数据集处理、格式转换及模型微调等内容。关键要点包括:
1.
主要计算机视觉任务及数据集:常见任务有图像分类、目标检测等,各任务有其关键数据集,如目标检测的COCO、VOC 。
2.
VOC数据集:用于对象检测等任务,有VOC2007和VOC2012两个主要子集,含20个对象类别,有标准化评估指标。数据分train、Validation、test子集,其YAML配置含路径等信息,可下载和转换格式。
3.
COCO数据集:用于对象检测等研究,有330K张图像,80个对象类别,提供标准化评估指标。数据集分Train2017、Val2017、Test2017 ,YAML配置类似VOC ,标注存于一个json文件。
4.
VOC和COCO示例及模型微调:两数据集图像多样,训练可用马赛克技术。在ultralytics中可基于COCO或VOC微调模型 。
5.
YOLO格式数据集处理:可对私有数据集进行格式转化、合并和采样等处理,结合工具自动打标,训练自定义模型。
6.
Pytorch_YoLo_From_Scratch系列教程:计划手撸多个YOLO版本模型,共用数据pipeline ,在关键数据集上精度对齐。
7.
VOC数据集项目操作:通过脚本下载、组织数据集,转换标签格式,还可自制小型toy数据集 。
🍞
YoLo Master项目
白皮书链接 YOLO Master白皮书规划
本文介绍了主要计算机视觉任务和典型的数据集,着重介绍了VOC和COCO数据集,并对实战教程中的数据集处理进行了详细的讲解
关联文档:
1.
YOLO实践之数据集合并与自动打标 @李欣桓 @程宏
飞书用户9928
飞书用户8611
GitHub 在本章教程中,我们选取的示例数据集来自鱼眼镜头_智能销售数据集饮料数据集两个数据集,我们会对两个数据集进行格式转化处理,合并和采样,来手把手的教大家如何进一步的处理私有数据集,训练自定义模型(YOLOv8m),结合打标工具X-AnyLabeling进行自动打标。
2.
YOLO系列算法实操教程
a.
YOLO系列入门实操教程【ultralytics YOLOv8m】
飞书用户8611
飞书用户3472
GitHub【Stanford Dogs Dataset basic tutorial with YOLOv8m】快速上手基于ultralytics YOLOv8m,并完成一个狗品种检测的实战项目。数据集来源于Stanford Dogs Dataset