机读格式显示(MARC)
- 010 __ |a 978-7-5170-6238-7 |d CNY89.80
- 099 __ |a CAL 012018072511
- 100 __ |a 20180521d2018 em y0chiy50 ea
- 200 1_ |a 揭秘深度强化学习 |A jie mi shen du qiang hua xue xi |f 彭伟编著
- 210 __ |a 北京 |c 中国水利水电出版社 |d 2018
- 215 __ |a x, 360页 |c 图 |d 23cm
- 225 2_ |a 人工智能技术丛书 |A ren gong zhi neng ji shu cong shu
- 314 __ |a 彭伟, AvatarWorks人工智能实验室研究员, 电子科技大学EE学士, 厦门大学计算机硕士。
- 330 __ |a 深度强化学习是深度学习算法和强化学习算法的巧妙结合, 它是一种新兴的通用人工智能算法技术, 也是机器学习的前沿技术, DRL算法潜力无限, AlphaGo是目前该算法最成功的使用案例。DRL算法以马尔科夫决策过程为基础, 是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划 (DP) 的算法以及基于策略优化的算法, 本书的目的就是要把这两种主要的算法 (及设计技巧) 讲解清楚, 使算法研究人员能够熟练地掌握。本书共10章, 首先以AlphaGo在围棋大战的伟大事迹开始, 引起对人工智能发展和现状的介绍, 进而介绍深度强化学习的基本知识。然后分别介绍了强化学习 (重点介绍蒙特卡洛算法和时序差分算法) 和深度学习的基础知识、功能神经网络层、卷积神经网络 (CNN)、循环神经网络 (RNN), 以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。引例、基础知识和实例相结合, 方便读者理解和学习。
- 410 _0 |1 2001 |a 人工智能技术丛书
- 606 0_ |a 机器学习 |A ji qi xue xi |x 研究
- 701 _0 |a 彭伟 |A peng wei |4 编著
- 801 _0 |a CN |b 湖北三新 |c 20180521
- 905 __ |a SCNU |f TP181/4225