MARC状态:订购 文献类型:中文图书 浏览次数:50
- 题名/责任者:
- Spark快速数据处理/(美)Holden Karau著 余璜,张磊译
- 出版发行项:
- 北京:机械工业出版社,2014.04
- ISBN及定价:
- 978-7-111-46311-5/CNY29.00
- 载体形态项:
- 16,114页;21cm
- 丛编项:
- 大数据技术丛书
- 个人责任者:
- (美) 凯洛 (Karau, Holden) 著
- 个人次要责任者:
- 余璜 译
- 个人次要责任者:
- 张磊 译
- 学科主题:
- 数据处理软件-程序设计
- 中图法分类号:
- TP274
- 版本附注:
- 由Packt Publishing授权出版
- 提要文摘附注:
- 本书系统讲解了Spark的应用方法,包括如下内容:第1章介绍如何在多种机器上安装Spark,以及如何配置一个Spark集群。第2章介绍如何在交互模式下运行第一个Spark作业。第3章介绍如何在Spark集群上构建一个生产级的脱机/独立作业。第4章介绍如何与Spark集群建立连接,以及SparkContext的使用。第5章介绍如何创建和保存RDD(弹性分布式数据集)。第6章介绍如何用Spark分布式处理你的数据。第7章介绍如何设置Shark,将Hive查询集成到你的Spark作业中来。第8章介绍如何测试Spark作业。第9章介绍如何提升Spark任务的性能。
- 使用对象附注:
- 本书适用于数据处理技术人员
全部MARC细节信息>>