保姆级教程:用ESP32-CAM和ESP-WHO SDK实现人脸检测,并控制LED灯(附源码避坑)
2026/4/12 8:36:55
在卷积神经网络(CNN)领域,有许多重要的研究和实用的数据集。Yann LeCun 等人的相关论文对卷积核的学习和反向传播进行了深入探讨,其中 [LBBH98] 是更全面的参考。Google 关于 Mnist 数字识别的教程也对理解卷积神经网络提供了帮助。
对于想要进一步实践的人,有几个不错的数据集可供选择:
-CFAIR 10 数据集:这是一个十类图像分类任务,与 Mnist 不同的是,它要识别的对象更复杂,如飞机、猫、青蛙等。图像为彩色,背景复杂,且待分类对象未居中,图像尺寸为 [32, 32, 3]。该数据集约有 60,000 张图像,可从 [Kri09] 下载,还有在线 Google 教程可用于构建相关神经网络。
-Imagenet 大规模视觉识别挑战赛数据集(ILSVRC):这是一个更具挑战性的数据集,包含 1000 种图像类型。在过去六七年里,它一直被用于计算机视觉研究的年度竞赛。2012 年是神经网络的重要一年,Alexnet 深度学习程序赢得了比赛,这是神经网络程序首次夺冠。以下是历年比赛的 top - 5 得分情况:
|年份|top - 5 得分|
| ---- | ---- |
|2012|15.5%|
|2013|11.2%|
|2014|6.7%|
|2015|3.6%|
|人类|5 - 10%|
从这些数据可以看出,随着时间的推移,神经网络在图像识别任务上的表现越来越好,甚至超过了人类的平均水平。