写在前面
无人机航拍图像中的小目标检测一直是计算机视觉领域的“硬骨头”——当目标像素小于32×32甚至只有十几像素时,传统IoU损失几乎“形同虚设”,模型训练时梯度消失,检测精度惨不忍睹。近年来,归一化Wasserstein距离(Normalized Wasserstein Distance, NWD)作为一种专为小目标设计的相似性度量方法,开始在YOLO社区掀起一阵“魔改”热潮。本文将深度解析NWD的数学原理、代码实现,并系统梳理YOLOv11结合NWD在无人机场景下的最新实践与性能表现。
无论你是正在肝论文的研究生,还是正在调参的算法工程师,抑或是想在自己的项目里“涨点”的YOLO玩家,这篇文章都值得你收藏细读。
一、问题:为什么YOLOv11原生的CIoU在小目标上“失灵”?
YOLOv11作为Ultralytics在2024年9月YOLO Vision 2024大会上发布的最新版本,集成了C3k2模块、C2PSA并行空间注意力机制等架构创新,在COCO数据集上以更少参数实现了更高精度,同时支持检测、分割、姿态估计、分类等多项任务。
然而,当我们将YOLOv11直接应用到无人机航拍场景时,一个根本性问题暴露出来:原生CIoU损失对小目标位置偏差极其敏感,且在两框不重叠时梯度消失。
根据阿里云开发者社区2025年2月发布的YOLOv11 NWD改进策略分析,IoU-Loss在以下三种情况中无法提供有效梯度:
- 预测框与真实框完全没有重叠(|P∩G|=0);