上周在客户现场调试,半夜接到电话说“系统误报太频繁,保安快被报警声搞崩溃了”。跑到机房一看,监控画面里树枝晃动、窗帘飘动全被标记成“入侵事件”。
这问题太典型了——很多团队直接把YOLOv11的COCO预训练模型往监控视频上一套,结果就是误报满天飞。今天咱们就聊聊怎么让YOLOv11在安防场景里真正靠谱起来。
监控场景的模型适配陷阱
直接加载官方的yolov11n.pt跑监控视频,头几天你可能觉得效果不错。但很快会发现几个致命问题:夜间红外画面检测率暴跌、小目标(比如远处翻墙的人)根本抓不到、风吹草动老是被误判成人形。问题出在数据分布——COCO数据集里可没有那么多模糊的红外图像,也没有那么多只占20像素的“人”。
我们得重新设计预处理流水线。监控摄像头通常输出1080P甚至4K流,但YOLOv11的输入默认是640x640。直接resize会丢失大量小目标信息。建议这样改:
# 监控专用预处理函数defsurveillance_preprocess(frame,target_size=12