机读格式显示(MARC)

000 01428nam 2200349 450

001 0000750082

005 20211020110000.0

010 __ |a 978-7-302-57820-8 |d CNY59.80

099 __ |a CAL 012021110931

100 __ |a 20211012d2021 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a afk a 000yy

106 __ |a r

200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |e 原理、算法与PyTorch实战 |f 刘全, 黄志刚编著

210 __ |a 北京 |c 清华大学出版社 |d 2021

215 __ |a xii, 243页, [12] 页图版 |c 图 (部分彩图) |d 26cm

225 2_ |a 水木书荟 |A shui mu shu hui

225 2_ |a 大数据与人工智能技术丛书 |A da shu ju yu ren gong zhi neng ji shu cong shu

300 __ |a 微课视频版

320 __ |a 有书目 (第 [241] -243页)

330 __ |a 本书共分三部分：第一和第二部分为表格式强化学习部分，着重介绍深度强化学习概述、环境的配置、数学建模、动态规划法、蒙特卡洛法、时序差分法、n-步时序差分法、规划和蒙特卡洛树搜索；第三部分为深度强化学习部分，着重介绍深度学习、PyTorch与神经网络、深度Q网络、策略梯度、基于确定性策略梯度的深度强化学习、AC框架的拓展。

410 _0 |1 2001 |a 水木书荟

410 _0 |1 2001 |a 大数据与人工智能技术丛书

517 1_ |a 原理、算法与PyTorch实战 |A yuan li 、 suan fa yu PyTorch shi zhan

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP181 |v 5

701 _0 |a 刘全 |A liu quan |4 编著

701 _0 |a 黄志刚 |A huang zhi gang |4 编著

801 _0 |a CN |b ZJU |c 20211012

905 __ |a SCNU |f TP181/0280

920 __ |a 242430 |z 1