MARC状态:审校 文献类型:中文图书 浏览次数:62
- 题名/责任者:
- 数据采集与预处理技术应用/安俊秀 ... [等] 编著
- 出版发行项:
- 北京:机械工业出版社,2023
- ISBN及定价:
- 978-7-111-73385-0/CNY59.90
- 载体形态项:
- 196页:图;26cm
- 丛编项:
- 面向新工科高等院校大数据专业系列教材
- 个人责任者:
- 安俊秀 编著
- 学科主题:
- 数据采集-高等学校
- 学科主题:
- 数据处理-高等学校
- 中图法分类号:
- TP274
- 一般附注:
- 信息技术新工科产学研联盟数据科学与大数据技术工作委员会推荐教材
- 书目附注:
- 有书目 (第196页)
- 提要文摘附注:
- 本书共有九章,从数据采集与预处理概述开始,介绍了大数据环境的搭建,并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术;数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle数据处理技术、Pig和OpenRefine这些数据预处理技术。旨在让读者了解并基本掌握当下主要的数据采集与预处理技术、工具,以及它们的使用方法。
全部MARC细节信息>>