超越全系列YOLO、Anchor-free+技巧组合，旷视开源更强的YOLOX( 三 )

但是在实践中，该研究发现通过Sinkhorn-Knopp算法解决OT问题会带来25%额外训练时间，这对于300epoch来说代价非常高。因此，该研究将其简化为动态top-k策略，命名为SimOTA ，以获得近似解。
SimOTA不仅减少了训练时间，同时避免了SinkhornKnopp算法中额外超参数问题。如表2所示， SimOTA将检测器的AP从45.0%提高到47.3% ，比SOTAultralytics-YOLOv3高出3.0% 。
端到端的YOLO
该研究参考PSS添加了两个额外的卷基层、一对一的标签分配、stopgradient 。这些使得检测器能够以端到端方式执行，但会略微降低性能和推理速度，如表2所示。该研究将其作为一个可选模块，但在最终的模型中并没有涉及。
在其他骨干网络的实验结果
除了DarkNet53 ，该研究还在其他不同大小的骨干上测试了YOLOX ，结果表明YOLOX都实现了性能提升。
改进YOLOv5中的CSPNet
为了公平的进行比较，该研究采用YOLOv5骨干，包括改进的CSPNet、SiLU激活函数、PAN头。此外，该研究还遵循扩展规则来生成YOLOXS、YOLOX-M、YOLOX-L、YOLOX-X模型。与YOLOv5在表3的结果相比，该模型在仅需非常少的额外推理耗时，取得了3.0%~1.0%的性能提升。

文章图片
Tiny和Nano检测器
该研究进一步将模型缩小为YOLOX-Tiny ，并与YOLOv4-Tiny进行比较。对于移动端设备，研究者采用深度卷积构建YOLOX-Nano模型，模型仅有0.91M参数量以及1.08GFLOP 。如表4所示， YOLOX在更小的模型尺寸下表现良好。

文章图片
模型大小与数据增强
在实验中，所有模型都保持了几乎相同的学习进度和优化参数。然而，研究发现适当的数据增强策略因模型大小而异。如表5所示， YOLOX-L采用MixUp能提高0.9%AP ，对于诸如YOLOX-Nano这种小型模型来说，最好是弱化增强。
具体来说，当训练诸如YOLOX-S、YOLOX-Tiny、YOLOX-Nano这种小模型时，需要去除混合增强并弱化mosaic（将扩展范围从[0.1,2.0]降到[0.5,1.5]）。这种改进将YOLOX-Nano的AP从24.0%提高到25.3% 。

文章图片
与SOTA结果对比
下表6为YOLOX与SOTA检测器的对比结果。在COCO2017test-dev数据集上进行了不同物体检测器的速度和准确率比较。研究者选择在300epoch上训练所有模型并进行了公平比较。由结果可得，与YOLOv3、YOLOv4、YOLOv5系列进行比较，该研究所提出的YOLOX取得了最佳性能，获得51.2%AP ，高于其他模型，同时具有极具竞争力的推理速度。

文章图片