超越全系列YOLO、Anchor-free+技巧组合,旷视开源更强的YOLOX
机器之心报道
编辑:杜伟、陈萍
在本文中 , 来自旷视的研究者提出高性能检测器YOLOX , 并对YOLO系列进行了经验性改进 , 将Anchor-free、数据增强等目标检测领域先进技术引入YOLO 。 获得了超越YOLOv3、YOLOv4和YOLOv5的AP , 而且取得了极具竞争力的推理速度 。
【超越全系列YOLO、Anchor-free+技巧组合,旷视开源更强的YOLOX】随着目标检测技术的发展 , YOLO系列始终追寻可以实时应用的最佳速度和准确率权衡 。 学界人士不断提取当时最先进的检测技术(如YOLOv2的anchor、YOLOv3的残差网络) , 并对这些检测技术进行优化以实现最佳性能 。 目前 , YOLOv5在速度和准确率上有最好的权衡 , 在COCO数据集上以13.7ms的速度获得48.2%AP 。
然而 , 过去两年时间里 , 目标检测领域的主要进展集中在无锚点(anchor-free)检测器、先进的标签分配策略以及端到端的(NMS-free)检测器 。 但是 , 这些技术还没有集成到YOLO系列模型中 , YOLOv4、YOLOv5仍然还是基于anchor的检测器 , 使用手工分配策略进行训练 。
近日 , 旷视的研究者将解耦头、数据增强、无锚点以及标签分类等目标检测领域的优秀进展与YOLO进行了巧妙地集成组合 , 提出了YOLOX , 不仅实现了超越YOLOv3、YOLOv4和YOLOv5的AP , 而且取得了极具竞争力的推理速度 。 
文章图片
论文地址:https://arxiv.org/abs/2107.08430项目地址:https://github.com/Megvii-BaseDetection/YOLOX考虑到YOLOv4、YOLOv5在基于anchorpipeline中可能会出现一些过拟合 , 研究者选择YOLOv3作为起点(将YOLOv3-SPP设置为默认的YOLOv3) 。 事实上 , 由于计算资源有限 , 以及在实际应用中软件支持不足 , YOLOv3仍然是业界应用最广泛的检测器之一 。
如下图1所示 , 通过将目标检测领域优秀进展与YOLO进行组合 , 研究者在图像分辨率为640×640的COCO数据集上将YOLOv3提升到47.3%AP(YOLOX-DarkNet53) , 大大超过了目前YOLOv3(44.3%AP , ultralyticsversion2)的最佳实践 。
此外 , 当将网络切换到先进的YOLOv5架构 , 该架构采用先进的CSPNet骨干以及一个额外的PAN头 , YOLOX-L在COCO数据集、图像分辨率为640×640获得50.0%AP , 比YOLOv5-L高出1.8%AP 。 研究者还在小尺寸上测试所设计的策略 , YOLOX-Tiny和YOLOX-Nano(仅0.91M参数和1.08GFLOPs)分别比对应的YOLOv4-Tiny和NanoDet3高出10%AP和1.8%AP 。 
文章图片
在CVPR2021WAD挑战赛的StreamingPerceptionChallenge赛道上 , 旷视提出的基于YOLOX模型(YOLOX-L)的2D实时目标检测系统在Argoverse-HD数据集上实现了41.1的streamingAP 。 此外 , 研究者在推理时用到了TensorRT优化器 , 使得模型在高分辨输入(即1440×2304)时实现了30fps的推理速度 。 
文章图片
图源:https://eval.ai/web/challenges/challenge-page/800/overview
YOLOX-DarkNet53
研究者选择将YOLOv3+Darknet53作为基线模型 , 并基于它详细介绍了YOLOX的整个系统设计 。
实现细节
从基线模型到最终模型 , 研究者的训练设置基本保持一致 。 他们在COCOtrain2017数据集上训练了300个epoch的模型并进行5个epoch的warmup , 使用随机梯度下降(SGD)来训练 , 学习率为lr×BatchSize/64 , 初始学习率为0.01 , 并使用了余弦(cosine)学习机制 。 权重衰减为0.0005 , SGDmomentum为0.9 。 批大小默认为128(8个GPU) , 其他批大小使用单个GPU训练也运行良好 。 输入大小以32步长从448均匀过渡到832 。 FPS和延迟在单个TeslaV100上使用FP16-precision和batch=1进行测量 。
- 剃须刀|华为不再孤单?国产巨头杀入5G领域,市值暴涨4千亿超越腾讯!
- MySQL|华为不再孤单?国产巨头杀入5G领域,市值暴涨4千亿超越腾讯!
- Python|华为再造新车!问界M7揭下外企的遮羞布,余承东:超越百万豪车
- 为什么老鹰的高度我们可超越,鲸鱼的最低下潜深度却做不到?
- 古人是如何知道时间的?他们对月亮的精准判断,超越人类科技
- 视频剪辑|超越同龄人,普通女生下班后如何自学自媒体视频剪辑?
- 销量|2022Q1中国最畅销智能手机公布:荣耀50超越iPhone 13 Pro Max
- 华为荣耀|为什么荣耀70 pro一机难求,能超越iPhone 13?
- 抖音|暴利音乐号项目-卖U盘,副业超越主业绝对有可能
- 苹果|华为超越了苹果,这个“事实”,其实并不值得骄傲
