大数据分析及应用实践(双色)(一体化教材)
作者: 马小东
出版时间:2016年5月
出版社:高等教育出版社
- 高等教育出版社
- 9787040449938
- 1版
- 92322
- 0062172912-8
- 16开
- 2016年5月
- 350
- 340
- 工学
- 计算机科学与技术
- TP311.13
- 计算机及相关专业
- 高职高专
本书主要内容包括认识大数据、大数据技术基础、大数据管理、大数据统计分析技术、数据挖掘、大数据可视化、大数据安全、大数据应用案例实操等。本书编写是以国云数据自主研发的大数据分析工具一一“魔镜”为平台,理论结合实践,通过具体案例介绍如何进行大数据分析。读者可通过移动设备扫描书中的二维码观看彩色图片、操作视频等多媒体教学资源,还可通过书后提供的账号与密码登录大数据实验科研平台(www.labbigdata.com)进行实践操作。
本书可作为高等院校大数据入门课程的教材,亦可作为大数据技术相关培训教材,同时也可供大数据相关的从业人员参考。
第1章 认识大数据
1.1 大数据综述
1.1.1 大数据的产生
1.1.2 大数据的特征
1.2 大数据的基本概念
1.2.l 大数据的定义
1.2.2 大数据的特点
1.3 大数据思维
1.3.1 大数据思维的变革
1.3.2 大数据思维的关注点.
1.4 大数据的处理过程
1.4.1 大数据采集
1.4.2 大数据导入与预处理
1.4.3 大数据统计与分析.
1.4.4 大数据挖掘
1.5 大数据分析工具
1.5.1 InfoSphere BigInSightS简介
1.5.2 BigQuery简介
1.5.3 “魔镜”简介
1.6 大数据的应用
1.6.1 大数据助石油公司智能营销.精准管理
1.6.2 大数据助乳业公司预测产奶量一
实验1 认识大数据分析工具“魔镜”
第2章 大数据技术基础
2.1 基础架构支持
2.1.1 Hadoop
2.1.2 HBase
2.1.3 MapReduce
2.1.4 Hive
2.1.5 Pig
2.1.6 R语言
2.2 云计算
2.2.1 云计算的特点
2.2.2 云计算与大数据
2.3 数据采集
2.3.1 数据采集的意义
2.3.2 数据采集的方法
2.4 数据存储
2.4.1 数据存储的概念
2.4.2 数据的存储方式
2.4.3 常见数据源类型
实验2 数据源接入与编辑
第3章 大数据管理
3.1 大数据的清洗
3.1.1 数据质量
3.1.2 数据清洗的作用
3.1.3 数据清洗的方法和过程
3.1.4 数据清洗的实例
3.2 数据类型和数据转换
3.2.1 数据类型
3.2.2 数据转换
3.3 大数据的提取和加载
实验3 数据处理
第4章 大数据统计分析技术
4.1 统计分析概述
4.1.1 统计分析的概念
4.1.2 统计分析的特点
4.1.3 统计分析的应用
4.2 统计分析的常见指标
4.2.l 统计指标概述
4.2.2 总量指标
4.2.3 相对指标
4.2.4 平均指标
4.2.5 变异指标
4.3 回归与预测
4.3.1 回归
4.3.2 预测
实验4数据分析
第5章 数据挖掘
5.1 大数据挖掘概念
5.1.1 数据挖掘的起源
5.1.2 数据挖掘的定义
5.2 数据挖掘任务
5.2.1 数据总结
5.2.2 分类
5.2.3 关联分析
5.2.4 聚类
5.3 数据挖掘流程
5.3.1 业务理解
5.3.2 数据理解
5.3.3 数据准备
5.3.4 建立模型
5.3.5 结果评价
5.4 数据挖掘的常用方法
5.4.l决策树
5.4.2 遗传算法
5.4.3 神经网络
5.4.4 关联规则
5.4.5 粗糙集
5.4.6 判别分析
实验5 数据挖掘
第6章 大数据可视化
6.1 数据可视化分类
6.1.1 结构可视化
6.1.2 功能可视化
6.1.3 关联关系可视化
6.1.4 趋势可视化
6.2 可视化表现形式
6.2.1 二维可视化形式
6.2.2 三维可视化形式
6.2.3 仪表盘
6.2.4 定制可视化形式.
6.2.5 大数据可视化方式的选择
实验6 数据可视化
第7章 大数据安全
7.1 大数据安全的内容
7.1.1 物理安全
7.1.2 网络安全
7.1.3 应用安全
7.1.4 数据隐私
7.2 数据保护技术
7.2.1 镜像技术
7.2.2 快照技术
7.2.3 持续数据保护技术
7.2.4 用户管理技术
实验7 权限管理机制.
第8章 大数据应用案例实操
8.1 学生成绩分析
8.1.1 背景分析
8.1.2 需求分析
8.1.3 大数据分析过程
8.1.4 分析结论
8.2 电商行业销售分析
8.2.1 背景分析
8.2.2 需求分析
8.2.3 大数据分析过程
8.2.4 分析结论
参考文献