神经网络的复兴：深度学习

受人脑神经元启发，通过构建更“深”的网络，AI获得了前所未有的模式识别能力。

输入层

输出层

数据在多个“隐藏层”之间流动，每一层都对信息进行更深层次的抽象和处理。

核心思想：从“浅层”到“深层”

传统机器学习模型通常是“浅层”的。而深度学习的关键在于“深度”，即神经网络包含许多隐藏层。这些层级结构使得模型能够从数据中自动学习到一个层次化的特征表示：浅层网络学习边缘、颜色等简单特征，而深层网络则能将这些简单特征组合起来，识别出物体的部件、乃至整个物体等更复杂的抽象概念。

专为处理图像等网格状数据设计，在计算机视觉领域取得巨大成功。

专为处理文本、语音等序列数据设计，能有效捕捉时间依赖关系。

革命性架构，依赖自注意力机制，成为当今大型语言模型的基础。

深度学习的成功归功于三大支柱的共同作用：

互联网时代产生了前所未有的海量数据，为训练复杂的深度模型提供了充足的“燃料”。

图形处理器（GPU）等并行计算硬件的发展，使得训练深层网络在时间和成本上成为可能。

ReLU激活函数、Dropout、Adam优化器等创新，有效解决了深度网络训练中的技术难题。