LeNet-5 是什么

LeNet-5 是深度学习先驱 Yann LeCun 等人在 1998 年提出的经典卷积神经网络(CNN),是现代 CNN 架构的奠基性开山之作。它最初设计用于 MNIST 手写数字识别任务,凭借「卷积提取特征 + 池化降维 + 全连接分类」的极简结构,成为了 FPGA 硬件加速入门的首选标准网络。


一、标准网络结构

LeNet-5 共 7 层可训练层(不含输入层),输入为 32×32 的单通道灰度图,最终输出 10 个分类结果(对应数字 0~9),完整层级如下:

层级类型核心参数输出尺寸
Input输入层单通道灰度图32×32×1
C1卷积层6个5×5卷积核,无填充28×28×6
S2池化层2×2 平均池化,步长214×14×6
C3卷积层16个5×5卷积核,无填充10×10×16
S4池化层2×2 平均池化,步长25×5×16
C5全连接卷积层120个神经元1×1×120
F6全连接层84个神经元84
Output输出层Softmax 分类10

它的核心设计范式沿用至今:用卷积层提取局部空间特征,用池化层压缩特征尺寸、扩大感受野,最后用全连接层完成分类输出。现在的 ResNet、YOLO 等复杂网络,本质都是在这个基础框架上做的扩展。


二、核心特点

  1. 结构极简,算子单一
    整个网络只用到卷积、池化、全连接三种算子,没有残差、注意力、归一化等复杂结构,逻辑清晰,非常适合作为硬件加速的入门验证对象。
  2. 计算量小,资源门槛低
    整体参数量仅约 6 万,计算量极低,在 Zynq-7000 这类中低端 FPGA 上就能完整实现纯 PL 端加速,不需要过高的资源储备。
  3. 验证标准成熟
    配套 MNIST 手写数字数据集,有大量公开的参考模型、精度指标和测试用例,软硬件对齐有明确的对标依据。

三、和你当前项目的关联

你刚打通的「卷积 + 池化」级联卷积块,正好对应 LeNet-5 里的C1+S2、C3+S4两组核心单元,是实现 LeNet-5 硬件加速的核心底座。

从当前进度推进到完整 LeNet-5 推理,只需要补充 3 项能力:

  1. 多通道支持:将当前单通道卷积/池化 IP,扩展为支持多输入通道、多输出通道,匹配 C1→S2→C3→S4 的通道维度变化。
  2. 卷积核尺寸扩展:从当前 3×3 卷积扩展支持 5×5 卷积,适配 LeNet-5 的标准卷积核尺寸(也可以做简化版,用 3×3 替代)。
  3. 全连接层 IP:新增一个全连接层硬件加速模块,完成 S4 到最终分类输出的计算。

全部实现后,就可以在你的 Zynq 平台上跑通端到端的手写数字图片分类推理,从「单个算子验证」升级为「完整 AI 模型硬件加速」,是非常合适的下一阶段里程碑。