Skip to content

深度学习在科学史上有着不同寻常的发展历程。一小群科学家坚持不懈地工作了二十五年,在一个看似前景黯淡的领域里,最终掀起了一场革命,对社会产生了深远的影响。通常情况下,当研究人员探究科学或工程领域中某个深奥且显然不实用的角落时,它仍然保持着那样的状态——深奥且不实用。然而,这是一个显著的例外。尽管普遍存在怀疑态度,但Yoshua Bengio、Geoffrey Hinton、Yann LeCun等人的系统性努力最终取得了成功。

本书名为“理解深度学习”,以区别于那些侧重于编程和其他实践层面的著作。本书主要关注深度学习背后的基本理念。书的第一部分介绍了深度学习模型,讨论了如何训练模型、评估其性能以及改进性能。接着探讨了专门用于图像、文本和图数据的架构。这些章节只需要初级的线性代数、微积分和概率知识,任何学习过量化学科的二年级本科生都能理解。后续章节涉及生成模型和强化学习,这些内容需要更多的概率和微积分知识,主要面向更高级的学生。

标题本身也带有一些玩笑的意味 — 在撰写本文时,没有人真正理解深度学习。现代深度网络学习的分段线性函数的区域比宇宙中的原子还多,并且可以用比模型参数更少的数据示例进行训练。我们既不能显而易见地可靠地拟合这些函数,也不能使它们很好地推广到新数据。倒数第二章讨论了这些以及其他尚未完全理解的方面。不管怎样,深度学习将会改变世界,无论是好是坏。最后一章讨论了人工智能伦理,并以呼吁从业者考虑其工作的道德影响作为结尾。

你的时间很宝贵,我努力精选和呈现材料,以便你能尽可能高效地理解它们。每章的主体部分都简明扼要地描述了最基本的概念,并配有相应的插图。附录回顾了所有必需的数学知识,你无需参考外部材料。对于想要深入研究的读者,每章都配有相关练习题、Python笔记本和详尽的背景说明。

写书是一个孤独、艰辛的多年过程,只有当书籍被广泛采用时才有价值。如果你喜欢阅读本书或有改进建议,请通过随书网站与我联系。我很乐意听取你的想法,这将有助于指导和激励后续版本的编写。