大数据技术与应用 / 大数据技术与应用专业规划教材
作者: 娄岩
出版时间:2016年11月
出版社:清华大学出版社
- 清华大学出版社
- 9787302451815
- 1-1
- 135967
- 0045178175-1
- 平装
- 16开
- 2016年11月
- 262
- 工学
- 计算机科学与技术
- TP274
- 计算机
- 本科
本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。
本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。
本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
前言
第1章 大数据概论
1.1 大数据技术简介
1.1.1 IT产业的发展简史
1.1.2 大数据的主要来源
1.1.3 数据生成的3种主要方式
1.1.4 大数据的特点
1.1.5 大数据的处理流程
1.1.6 大数据的数据格式
1.1.7 大数据的基本特征
1.1.8 大数据的应用领域
1.2 大数据的技术架构
1.3 大数据的整体技术
1.4 大数据分析的4种典型工具简介
1.5 大数据未来发展趋势
1.5.1 数据资源化
1.5.2 数据科学和数据联盟的成立
1.5.3 大数据隐私和安全问题
1.5.4 开源软件成为推动大数据发展的动力
1.5.5 大数据在多方位改善人们的生活
本章小结
习题
第2章 大数据采集及预处理
2.1 数据采集简介
2.1.1 数据采集
2.1.2 数据采集的数据来源
2.1.3 数据采集的技术方法
2.2 大数据的预处理
2.3 大数据采集及预处理的主要工具
本章小结
习题
第3章 大数据分析概论
3.1 大数据分析简介
3.1.1 大数据分析
3.1.2 大数据分析的基本方法
3.1.3 大数据处理流程
3.2 大数据分析的主要技术
3.2.1 深度学习
3.2.2 知识计算
3.3 大数据分析处理系统简介
3.3.1 批量数据及处理系统
3.3.2 流式数据及处理系统
3.3.3 交互式数据及处理系统
3.3.4 图数据及处理系统
3.4 大数据分析的应用
本章小结
习题
第4章 大数据可视化
4.1 大数据可视化简介
4.2 大数据可视化工?
本章小结
习题
第5章 Hadoop概论
5.1 Hadoop简介
5.1.1 Hadoop简史
5.1.2 Hadoop应用和发展趋势
5.2 Hadoop的架构与组成
5.2.1 Hadoop架构介绍
5.2.2 Hadoop组成模块
5.3 Hadoop应用分析
本章小结
习题
第6章 HDFS和Common概论
6.1 HDFS简介
6.1.1 HDFS的相关概念
6.1.2 HDFS特性
6.1.3 HDFS体系结构
6.1.4 HDFS的工作原理
6.1.5 HDFS的相关技术
6.2 Common简介
本章小结
习题
第7章 MapReduce概论
7.1 MapReduce简介
7.1.1
7.1.2 MapReduce功能、特征和局限性
7.2 Map和Reduce任务
7.3 MapReduce架构和工作流程
7.3.1 MapReduce的架构
7.3.2 MapReduce的工作流程
本章小结
习题
第8章 NoSQL概论
8.1 NoSQL简介
8.1.1 NoSQL的含义
8.1.2 NoSQL的产生
8.1.3 NoSQL的特点
8.2 NoSQL技术基础
8.2.1 大数据的一致性策略
8.2.2 大数据的分区与放置策略
8.2.3 大数据的复制与容错技术
8.2.4 大数据的缓存技术
8.3 NoSQL的类型
8.3.1 键值存储
8.3.2 列存储
8.3.3 面向文档存储
8.3.4 图形存储
8.4 典型的NoSQL工具
8.4.1 Redis
8.4.2 Bigtable
8.4.3 CouchDB
本章小结
习题
第9章 Spark概论
9.1 Spark平台
9.1.1 Spark简介
9.1.2 Spark发展
9.1.3 Scala语言
9.2 Spark与
9.2.1 Hadoop的局限与不足
9.2.2 Spark的优点
9.2.3 Spark速度比Hadoop快的原因分解
9.3 Spark处理框架及其生态系统
9.3.1 底层的Cluster Manager和Data
9.3.2 中间层的Spark
9.3.3 高层的应用模块
9.4 Spark的应用
9.4.1 Spark的应用场景
9.4.2 应用Spark的成功案例
本章 小结
习题
第10章 云计算与大数据
10.1 云计算简介
10.1.1 云计算
10.1.2 云计算与大数据的关系
10.1.3 云计算基本特征
10.1.4 云计算服务模式
10.2 云计算核心技术
10.2.1 虚拟化技术
10.2.2 虚拟化软件及应用
10.2.3 资源池化技术
10.2.4 云计算部署模式
10.3 云计算应用案例
本章小结
习题
第11章 典型大数据解决方案
11.1 Intel大数据
11.1.1 Intel大数据解决方案
11.1.2 Intel大数据相关案例
11.2 百度大数据
11.2.1 百度大数据引擎
11.2.2 百度大数据+平台
11.2.3 相关应用
11.2.4 百度预测的使用方法
11.3 腾讯大数据
11.3.1 腾讯大数据解决方案
11.3.2 相关实例
本章小结
习题
附录A习题答案
参考文献