清华大学出版社 您所在的位置:网站首页 袁莎老师微信 清华大学出版社

清华大学出版社

2024-06-27 17:39| 来源: 网络整理| 查看: 265

本书构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。本书 首先回顾了相关预备知识,包括数学基础和机器学习基础,然后先介绍强化学习的基本概念,给出强化学习的 数学框架(马尔可夫决策过程),随后介绍强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法 和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前 沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的** 研究进展。本书配有相当数量的习题供练习,配套代码基于 Python 实现,源代码均已开源,可开放获取。 本书可作为理工科本科生、研究生的“强化学习”课程的教材,也可作为相关从业者掌握强化学习的入门 参考书。

more >

前 言 人工智能的发展经历了三次浪潮,从空中楼阁到象牙之塔,现今走进了万间广厦。近十年,以深度学习为发端的第三次人工智能浪潮带来很多变化,有别于前两次浪潮的大浪淘沙,这次人工智能浪潮正呈席卷之势,引领新一代科学技术的发展,改变着每个领域、每个行业,也普惠着生活在这个时代的每一个人。 人工智能技术已经融入越来越多的行业,应用在越来越广的场景之中。人工智能开发的难易程度,也从十年前的高不可攀到如今走进千家万户,未来可期成为多数工程师的必备技能,这背后自然离不开每一位教育工作者的艰苦努力,也离不开每一本技术专著作者的辛勤付出。回看我国高校人工智能专业的发展历史,系统化的学科建设时间还不算长,从完备的学科设置到专业的师资队伍建设,再到相匹配的教材研发还需要进一步加强和完善。在我任教的清华大学,对于新兴学科,师资、教研、教辅等方面与时俱进,但若想更多更广地惠及对人工智能技术感兴趣的大学生群体或相关技术人员,还需要把这门学科的门槛尽快降低。 本书的出发点正是秉持这一要旨,将强化学习技术的学习与运用的门槛尽可能地降低。强化学习是机器学习的重要分支,在学习强化学习的过程中会涉及概率、统计、运筹等数理知识。同时,强化学习又是一门实践性非常强的技术,市面上现有的强化学习书籍的学习门槛还相对较高,对初学者不够友好。因此,本书的目标定位是面向所有具有相关计算机和数学基础的大学生、工程技术人员,旨在让本书的读者在强化学习领域从零起步了解并掌握算法,快速应用这些思想、技术和方法。 本书通过严谨简明的预备知识介绍,有的放矢地为读者梳理强化学习中涉及的数学知识,然后以强化学习拟解决的问题为着眼点,将强化学习要解决的问题转化为求解马尔可夫模型,接着循序渐进地给出了求解此模型的基础求解方法和优化求解方法。本书在编写过程中侧重于实践应用,通过算法原理与实践案例的结合,由浅入深地导入强化学习的概念和方法,提高读者的兴趣,降低入门的难度。希望本书能够普惠更多希望学习人工智能技术的学生及工程技术人员,让他们掌握强化学习的方法,并能灵活地用其解决实际问题。同时,也可以把人工智能技术的思维带到他们平时的学习和工作中,启发他们对机器智能进行思考与探索。 未来十年,人工智能领域的教育必将得到普及。为社会培养更多人工智能方面的学生和工程技术人员,尽量降低人工智能的入门门槛,是本书作者的初心。 清华大学计算机科学与技术系教授、系副主任 唐杰 2021 年5 月

more > 课件下载 样章下载 暂无网络资源 扫描二维码 下载APP了解更多

版权图片链接



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有