程序员尊称他“大神”，李沐却说：比我厉害的人多了

您所在的位置：网站首页 › 清清是哪里人 › 程序员尊称他“大神”，李沐却说：比我厉害的人多了

程序员尊称他“大神”，李沐却说：比我厉害的人多了

2023-03-07 12:13| 来源: 网络整理| 查看: 265

知乎上有个问题，“孩子今年开学上小学五年级了，现在报课外班学Tensorflow还来得及吗？”有近百万的浏览。

其中有个回答是：有点晚。我家娃一岁开始就开始读Paper，现在已经可以熟练敲键盘写MXNet代码，虽然语法错误还比较多。他妈妈在Google上班是用TensorFlow，但他对MXNet兴趣更大一点。不过比起敲代码，调参他更在行。

随回答还附上了一张小孩在电脑前玩耍的照片。

拿现在流行的话说，如此“凡尔赛”，非但没被怼，截止到目前，知乎上显示已有超过2450个赞。

为什么这么反常规？

不仅是因为这个回答很皮，还因为答主是李沐！

从李沐《博士这五年》一文

看天才少年的人生选择

李沐是谁？

他是硅谷华人技术人才，深度学习框架MXNet作者之一，也是《动手学深度学习》作者之一。

2004年，李沐从计算机系ACM班毕业。上海交通大学ACM班是以培养计算机科学家而闻名的“特色班”，自大学起李沐就开启了他的开挂人生。

这是李沐的职业生涯路径：

顺带一提，上面李沐提到的“孩子的妈妈”，也就是他妻子，也是业内很厉害的人物。2012年，李沐选择离开百度前往CMU深造时，他妻子当时也被MIT录取，这也成为了他选择去CMU学习的一大重要原因。后来李沐的妻子入职Google。

李沐究竟是个怎样的人？他在人生重要节点上是如何做选择的？这些答案，可以从他的《博士这五年》一文窥见一二。

「答辩前一天的晚上，

我想了两个问题，

一个是“博士收获最大的是什么”，

另一个是“如果可以重来会怎么办”。」

——李沐《博士这五年》

01 读博收获最大的是什么？

2012年8月12日，李沐早上去公司开完会，中午正式辞去百度高级研究员的工作，奔赴机场，准备进入CMU研读博士。

“在百度的经历让我学到了很多，也更清楚地发现了自己的短板。但是当时国内做系统方向的人比较少，所以我还是选择了去美国继续攻读博士。”

初到美国，李沐是迷茫的， “2012年8月提着一个行李箱降落在匹兹堡机场。没找住的地方，也不知道CMU应该怎么去。对未来一片迷茫，但充满乐观。” 经过5年学习，他自己总结收获很多：“这五年时间自然学到了很多东西，例如系统地学习了分布式系统，紧跟了机器学习这五年的发展，写文章做幻灯片做报告水平有提升，代码能力也加强了些。自信上有所提高，觉得既可以做一流的研究，也可以写跟大团队PK的代码。只要努力，对手没什么可怕的。”

除了学术收获、专业能力提升、自信心提升，还有不少人脉的积累：“CMU课程比较重，博士需要学8门课，每门课工作量巨大。而且要求做两门课助教，做助教比上课更累。除了上课，更重要是做研究。我去CMU的时候Alex那时还在Google，而且没经费，所以把我丢给了Dave Andersen。于是我有了两个导师，一个做机器学习，一个做分布式系统。”

02 如果可以重来会怎么办？

对于这个问题，李沐在《博士这五年》里写到：

“第二个问题的一个选项是当年留在国内会怎么样？当年百度的伙伴们多数现在都做得很好，都在引领这一波AI的潮流，甚至有好几个创造了上亿价值的公司。所以从金钱或者影响力角度来看，一直在工业界也不差，说不定现在已经是土豪了。

不过我觉得还是会选择读博。赚钱以后还有大把时间可以，但是能花几年时间在某个领域从入门到精通甚至到推动这个领域发展的机会就一次。站在这个领域的高点会发现世界虽然很大，但其实其他领域也使用差不多的技术，有着同样的发展规律。博士期间领悟到的学习的方法可以在各个方向上都会大有作为。”

“在某个领域从入门到精通甚至到推动这个领域发展”是他在博士期间以及日后工作中做的重点事项——出于对MXNet未来发展的考量，在毕业后的职业选择上，李沐放弃了加入Google的机会，而是去了Amazon，一直任职至今，展开围绕MXNet的相关项目，后又写出了用MXNet实现的教材——《动手学深度学习》。

作者：阿斯顿·张（Aston Zhang）、李沐（Mu Li）、[美] 扎卡里·C. 立顿（Zachary C. Lipton）、[德] 亚历山大·J. 斯莫拉（Alexander J. Smola）

MXNet的创建与《动手学深度学习》的演变历程

博士学习第三年，李沐跟陈天奇在GitHub上创建了一个叫DMLC的组织，用来加强合作和沟通。真正让DMLC社区壮大的项目是第三个，就叫做MXNet。当时，李沐同时在做difacto和MXNet两个项目，在同吴恩达的一次见面之后，李沐听从了他的建议，把全部精力放在了MXNet。

博士学习第四年，李沐开始以兼职的身份去了Amazon，领着团队做些MXNet开发和AWS上深度学习的应用，毕业后也留在了Amazon。

2018年，李沐及其团队发现一个问题：AI虽然火，但是门槛太高，导致能参与到落地的用户并不多。他们意识到自己当时的使命就是把这人工智能的生态圈做得更大一些，于是萌发录一个更加正式的质量更高的MOOC的想法。

但由于担心线上课程不能实时得到反馈，所以李沐和其同伴决定先去伯克利（Berkeley）教一遍积累些经验。2019年春季李沐跟Alex Smola一起在伯克利教学，教学后通常他们会在一两天内把课程视频上传到YouTube，以供更多人免费学习。

授人以渔，这成为了李沐的新目标，他随后出版的交互式书籍《动手学深度学习》也是为了实现这一目标而撰写的。

2017年，市面上并没有特别适用的深度学习入门书，李沐和其团队想要一本既能讲原理、又有实现和实际使用、不断更新、而且容易读的书，于是就开始着手写一本深度学习的教材。经过两年摸索，2019年，《动手学深度学习》一书逐渐成熟，英文版和中文版相继成型，首先发布在博客上。

这本书代码的实现很多是基于MXNet（一开始的目标是为MXNet写个好点文档），李沐和团队也考虑过要不要提供一个PyTorch或者Keras的版本。后来发现这个担心比较多余。框架就是一个工具，工具之间的那些不同带来的困难比起理解模型和调出结果来小很多。课上发现就算是没有接触过这些工具的学生，用MXNet做作业，然后在基于不管用啥框架实现的现有算法再开发做项目并没有多大困难。或者说困难都不来自工具本身，特别是算法实现都在课上讲过一遍的情况下。

随着影响力变大，李沐团队感到责任越来越大。他们的目标也从“为MXNet写个好文档”变成“让更多人能容易学习并使用深度学习技术”。今年六月他们朝这个目标迈出了重要的一步：为本书的前7章，从线性模型到现代卷积神经网络，提供基于PyTorch的实现。

授人以鱼不如授人以渔，不难看出，这也是李沐的一项过人之处。他的专业技能，他的业界长远发展眼光，令人折

不过，对于别人的夸赞，李沐始终保有一颗平常心，“比我厉害的人多了，千万别叫我大神”。

3.想钻研深度学习？不妨从这本备受赞誉的书开始

除了李沐传奇的人生引人关注与羡慕外，李沐的《动手学深度学习》也被当作业内入门深度学习的优秀教材。这本由李沐、美国伊利诺伊大学香槟分校计算机科学博士 Aston Zhang、李沐在 CMU 的导师 Alex Smola ，以及来自社区的 100 多位贡献者合著。书籍一经推出便大受欢迎，一度登上京东科技类图书热销榜 Top 1 。

自《动手学深度学习》面市以来，就备受学术界与工业界赞誉：

截至目前，已有140多所院校使用《动手学深度学习》这本书作为教材。

01 全面介绍深度学习的方方面面这本书全面介绍深度学习从模型构造到模型训练的方方面面，以及它们在计算机视觉和自然语言处理中的应用；不仅将阐述算法原理，还将基于Apache MXNet对算法进行实现，并实际运行它们。

本书的结构图

书的每一章用文字、数学、图示和代码来多方面介绍一个知识点。它是一个Jupyter记事本，可以独立运行。包含20个左右的文字和代码块，可以15分钟左右读完。

02 搭配视频+编程练习一起使用，还可随时讨论

这本书有一个非常显著的特色：互动性+实践性，主要面向在校大学生、技术人员和研究人员。在校学生和老师可以申请用于本书学习或教学的免费计算资源。

书籍将文字、公式、图像、代码和运行结果结合在了一起，不仅在阐述知识和原理，同时还有课件和视频进行演示。

教程已在GitHub上开源，动手能力强的同学自己可以尝试一下。不过需要注意的是，所有markdown文件需要在提交前清除output，它们会在服务器上重新执行生成结果。所以需要保证每个记事本执行不要太久，时间不超过十分钟。

执行无误后直接用三种格式发布在网上：含有执行输出的Jupyter记事本，可以直接浏览的HTML，和适合打印的PDF。

每章后面都有讨论环节，读者可以随时进行讨论。

03 根据读者的反馈进行补充讲解

全书补充知识众多，李沐会根据读者的反馈进行补充讲解，以便让书籍更加适用。

例如，在《动手学深度学习》出版后，常常有读者反映自己的数学基础薄弱，难以理解深度学习。为此，李沐团队和亚马逊的机器学习大学合作，专门增加了“深度学习的数学”一章，详细阐述理解深度学习所需的数学背景知识。

同样，这一数学篇章也沿袭了全书的书写风格：

同时，他们完全重写了“预备知识”一章，全面改进内容的准确性和可读性。例如，在不过多使用术语的前提下，全章开头试图从多个角度激发读者阅读各小节的兴趣：

再例如，今年7月《动手学深度学习》新增TensorFlow实现。

回过头来看，李沐的一系列动作，其实都离不开我们之前提到的他的初心，“在某个领域从入门到精通甚至到推动这个领域发展”。

作者：阿斯顿·张（Aston Zhang）、李沐（Mu Li）、 [美] 扎卡里·C. 立顿（Zachary C. Lipton）、[德] 亚历山大·J. 斯莫拉（Alexander J. Smola）

内容简介：

本书不仅阐述深度学习的算法原理，还演示它们的实现和运行。本书共分3个部分：第一部分介绍深度学习的背景，提供预备知识，并包括深度学习最基础的概念和技术；第二部分描述深度学习计算的重要组成部分，还解释近年来令深度学习在多个领域大获成功的卷积神经网络和循环神经网络；第三部分评价优化算法，检验影响深度学习计算性能的重要因素，并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。

【本文地址】

公司简介

联系我们