机读格式显示(MARC)
- 010 __ |a 978-7-111-73385-0 |d CNY59.90
- 099 __ |a CAL 012023125980
- 100 __ |a 20231030d2023 em y0chiy50 ea
- 200 1_ |a 数据采集与预处理技术应用 |A shu ju cai ji yu yu chu li ji shu ying yong |d = Data collection and preprocessing technology |f 安俊秀 ... [等] 编著 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2023
- 215 __ |a 196页 |c 图 |d 26cm
- 225 2_ |a 面向新工科高等院校大数据专业系列教材 |A mian xiang xin gong ke gao deng yuan xiao da shu ju zhuan ye xi lie jiao cai
- 300 __ |a 信息技术新工科产学研联盟数据科学与大数据技术工作委员会推荐教材
- 330 __ |a 本书共有九章,从数据采集与预处理概述开始,介绍了大数据环境的搭建,并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术;数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle数据处理技术、Pig和OpenRefine这些数据预处理技术。旨在让读者了解并基本掌握当下主要的数据采集与预处理技术、工具,以及它们的使用方法。
- 410 _0 |1 2001 |a 面向新工科高等院校大数据专业系列教材
- 510 1_ |a Data collection and preprocessing technology |z eng
- 606 0_ |a 数据采集 |A shu ju cai ji |x 高等学校
- 606 0_ |a 数据处理 |A shu ju chu li |x 高等学校
- 701 _0 |a 安俊秀 |A an jun xiu |4 编著
- 801 _0 |a CN |b ZJUT |c 20231030
- 905 __ |a SCNU |f TP274/3022/ 2