MARC状态:审校 文献类型:中文图书 浏览次数:101
- 题名/责任者:
- Spark高级数据分析/(美) 桑迪·里扎 ... [等] 著 龚少成, 邱鑫译
- 出版发行项:
- 北京:人民邮电出版社,2018
- ISBN及定价:
- 978-7-115-48252-5/CNY69.00
- 载体形态项:
- xviii, 226页:图;24cm
- 丛编项:
- 图灵程序设计丛书
- 个人责任者:
- 里扎 (Ryza, Sandy) 著
- 个人责任者:
- 莱瑟森 (Laserson, Uri) 著
- 个人责任者:
- 欧文 (Owen, Sean) 著
- 个人次要责任者:
- 龚少成 译
- 个人次要责任者:
- 邱鑫 译
- 学科主题:
- 数据处理软件
- 中图法分类号:
- TP274
- 题名责任附注:
- 题名页题其余责任者: (美) 于里·莱瑟森, (英) 肖恩·欧文, (美) 乔希·威尔斯著
- 版本附注:
- 译自原书第2版
- 出版发行附注:
- 英文原版的翻译得到O'Reilly Media, Inc.的授权 O'Reilly Media, Inc.授权人民邮电出版社出版
- 责任者附注:
- 桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。
- 提要文摘附注:
- 本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。
全部MARC细节信息>>