深入理解大数据:大数据处理与编程实践 / 计算机类专业系统能力培养系列教材、十二五国家重点图书出版规划
作者: 黄宜华
出版时间:2014年7月
出版社:机械工业出版社
- 机械工业出版社
- 9787111473251
- 1版
- 180252
- 0044166581-7
- 压膜
- 16开
- 2014年7月
- 450
- 518
- 工学
- 计算机科学与技术
- TP274
- 计算机
- 本科
本书是国内第一本基于多年课堂教学实践总结和撰写而成的大数据处理和并行编程技术书籍,因此,本书非常适合高等院校作为MapReduce大数据并行处理技术课程教材使用,同时也很适合于高等院校学生作为自学ManReduce并行处理技术的参考书。与此同时,由于本书包含了很多来自业界实际产品的深度技术内容、井包括了丰富的算法设计和编程实战案例,因此,本书也很适合作为IT和其他应用行业专业技术人员进行大数据处理应用开发和编程实现时的参考手册。
推荐序一
推荐序二
推荐序三
丛书序言
前 言
第一部分 Hadoop系统
第1章 大数据处理技术简介
1.1 并行计算技术简介
1.1.1 并行计算的基本概念
1.1.2 并行计算技术的分类
1.1.3 并行计算的主要技术问题
1.2 大数据处理技术简介
1.2.1 大数据的发展背景和研究意义
1.2.2 大数据的技术特点
1.2.3 大数据研究的主要目标、基本原则和基本途径
1.2.4 大数据计算模式和系统
1.2.5 大数据计算模式的发展趋势
1.2.6 大数据的主要技术层面和技术内容
1.3 MapReduce并行计算技术简介
1.3.1 MapReduce的基本概念和由来
1.3.2 MapReduce的基本设计思想
1.3.3 MapReduce的主要功能和技术特征
1.4 Hadoop系统简介
1.4.1 Hadoop的概述与发展历史
1.4.2 Hadoop系统分布式存储与并行计算构架
1.4.3 Hadoop平台的基本组成与生态系统
1.4.4 Hadoop的应用现状和发展趋势
第2章 Hadoop系统的安装与操作管理
2.1 Hadoop系统安装方法简介
2.2 单机和单机伪分布式Hadoop系统安装基本步骤
2.2.1 安装和配置
2.2.2 创建Hadoop用户
2.2.3 下载安装H
2.2.4 配置
2.2.5 配置Hadoop环境
2.2.6 Hadoop的运行
2.2.7 运行测试程序
2.2.8 查看集群状态
2.3 集群分布式Hadoop系统安装基本步骤
2.3.1 安装和配置
2.3.2 创建Hadoop用户
2.3.3 下载安装H
2.3.4 配置
2.3.5 配置Hadoop环境
2.3.6 Hadoop的运行
2.3.7 运行测试程序
2.3.8 查看集群状态
2.4 Hadoop MapReduce程序开发过程
2.5 集群远程作业提交与执行
2.5.1 集群远程作业提交和执行过程
2.5.2 查看作业执行结果和集群状态
第3章 大数据存储——分布式文件系?
3.1 HDFS的基本特征与构架
第4章 Hadoop MapReduce并行编程框架
第5章 分布式数据库
第6章 分布式数据仓库
第7章 Intel Hadoop系统优化与功能增强
第二部分 MapReduce的编程和算法设计
第8章 MapReduce基础算法程序设计
第9章 MapReduce高级程序设计技术
第10章 MapReduce数据挖掘基础算法
第11章 大数据处理算法设计与应用编程案例
附 录
附录A OpenMP并行程序设计简介
附录B MPI并行程序设计简介
附录C 英特尔Apache Hadoop*系统安装手册
参考文献