机读格式显示(MARC)

000 01533nam 2200349 450

001 0000719186

005 20210309091800.0

010 __ |a 978-7-111-64812-3 |d CNY45.00

099 __ |a CAL 012020059061

100 __ |a 20200514d2020 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a TensorFlow强化学习快速入门指南 |A TensorFlow qiang hua xue xi kuai su ru men zhi nan |e 使用Python动手搭建自学习的智能体 |f (美) 考希克·巴拉克里希南著 |g 赵卫东译

210 __ |a 北京 |c 机械工业出版社 |d 2020

215 __ |a XII, 108页 |c 图 |d 24cm

225 2_ |a 大数据丛书 |A da shu ju cong shu

305 __ |a 据2018年英文版译出

306 __ |a 由Packt Publishing Ltd授权出版本书限中国大陆发行

312 __ |a 原文题名取自版权页

330 __ |a 本书首先介绍了强化学习的基本原理，然后介绍典型的强化学习算法，包括时序差分、SARSA、Q-Learning、DeepQ-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等，每种算法基本上利用了主流的开源机器学习框架TensorFlow，使用Python编程进行实现。

410 _0 |1 2001 |a 大数据丛书

500 10 |a TensorFlow reinforcement learning quick start guide |m Chinese

517 1_ |a 使用Python动手搭建自学习的智能体 |A shi yong Python dong shou da jian zi xue xi de zhi neng ti

606 0_ |a 人工智能 |A ren gong zhi neng |x 算法

690 __ |a TP18 |v 5

701 _1 |a 巴拉克里希南 |A ba la ke li xi nan |g (Balakrishnan, Kaushik) |4 著

702 _0 |a 赵卫东 |A zhao wei dong |4 译

801 _0 |a CN |b WHUTL |c 20200622

905 __ |a SCNU |f TP18/1020/ 1

920 __ |a 242430 |z 1