超越全系列YOLO、Anchor-free+技巧组合,旷视开源更强的YOLOX( 三 )
但是在实践中 , 该研究发现通过Sinkhorn-Knopp算法解决OT问题会带来25%额外训练时间 , 这对于300epoch来说代价非常高 。 因此 , 该研究将其简化为动态top-k策略 , 命名为SimOTA , 以获得近似解 。
SimOTA不仅减少了训练时间 , 同时避免了SinkhornKnopp算法中额外超参数问题 。 如表2所示 , SimOTA将检测器的AP从45.0%提高到47.3% , 比SOTAultralytics-YOLOv3高出3.0% 。
端到端的YOLO
该研究参考PSS添加了两个额外的卷基层、一对一的标签分配、stopgradient 。 这些使得检测器能够以端到端方式执行 , 但会略微降低性能和推理速度 , 如表2所示 。 该研究将其作为一个可选模块 , 但在最终的模型中并没有涉及 。
在其他骨干网络的实验结果
除了DarkNet53 , 该研究还在其他不同大小的骨干上测试了YOLOX , 结果表明YOLOX都实现了性能提升 。
改进YOLOv5中的CSPNet
为了公平的进行比较 , 该研究采用YOLOv5骨干 , 包括改进的CSPNet、SiLU激活函数、PAN头 。 此外 , 该研究还遵循扩展规则来生成YOLOXS、YOLOX-M、YOLOX-L、YOLOX-X模型 。 与YOLOv5在表3的结果相比 , 该模型在仅需非常少的额外推理耗时 , 取得了3.0%~1.0%的性能提升 。 
文章图片
Tiny和Nano检测器
该研究进一步将模型缩小为YOLOX-Tiny , 并与YOLOv4-Tiny进行比较 。 对于移动端设备 , 研究者采用深度卷积构建YOLOX-Nano模型 , 模型仅有0.91M参数量以及1.08GFLOP 。 如表4所示 , YOLOX在更小的模型尺寸下表现良好 。 
文章图片
模型大小与数据增强
在实验中 , 所有模型都保持了几乎相同的学习进度和优化参数 。 然而 , 研究发现适当的数据增强策略因模型大小而异 。 如表5所示 , YOLOX-L采用MixUp能提高0.9%AP , 对于诸如YOLOX-Nano这种小型模型来说 , 最好是弱化增强 。
具体来说 , 当训练诸如YOLOX-S、YOLOX-Tiny、YOLOX-Nano这种小模型时 , 需要去除混合增强并弱化mosaic(将扩展范围从[0.1,2.0]降到[0.5,1.5]) 。 这种改进将YOLOX-Nano的AP从24.0%提高到25.3% 。 
文章图片
与SOTA结果对比
下表6为YOLOX与SOTA检测器的对比结果 。 在COCO2017test-dev数据集上进行了不同物体检测器的速度和准确率比较 。 研究者选择在300epoch上训练所有模型并进行了公平比较 。 由结果可得 , 与YOLOv3、YOLOv4、YOLOv5系列进行比较 , 该研究所提出的YOLOX取得了最佳性能 , 获得51.2%AP , 高于其他模型 , 同时具有极具竞争力的推理速度 。 
文章图片
- 剃须刀|华为不再孤单?国产巨头杀入5G领域,市值暴涨4千亿超越腾讯!
- MySQL|华为不再孤单?国产巨头杀入5G领域,市值暴涨4千亿超越腾讯!
- Python|华为再造新车!问界M7揭下外企的遮羞布,余承东:超越百万豪车
- 为什么老鹰的高度我们可超越,鲸鱼的最低下潜深度却做不到?
- 古人是如何知道时间的?他们对月亮的精准判断,超越人类科技
- 视频剪辑|超越同龄人,普通女生下班后如何自学自媒体视频剪辑?
- 销量|2022Q1中国最畅销智能手机公布:荣耀50超越iPhone 13 Pro Max
- 华为荣耀|为什么荣耀70 pro一机难求,能超越iPhone 13?
- 抖音|暴利音乐号项目-卖U盘,副业超越主业绝对有可能
- 苹果|华为超越了苹果,这个“事实”,其实并不值得骄傲
