注册 登录 进入教材巡展
#
  • #

出版时间:2016年3月

出版社:清华大学出版社

以下为《大数据基础与管理》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 清华大学出版社
  • 9787302425236
  • 1-1
  • 26375
  • 0044177988-1
  • 平装
  • 16开
  • 2016年3月
  • 工学
  • 控制科学与工程
  • TP274
  • 计算机
  • 本科
内容简介
段竹、田宏主编的《大数据基础与管理》从理论结合实践的角度,讲解大数据的概念和技术。全书共分为7章,主要内容包括什么是大数据、大数据的特征、大数据的作用与应用、大数据的技术与分析;通过实例讲解Data Studio的使用方法,DB2、UDB和JDBC的相关知识,集成数据管理的知识,IBM InfoSphere软件;详细讨论大数据环境下的安全与治理;通过实例讲解了Hadoop技术。
目录

第1章  大数据概论


  1.1 什么是大数据


  1.2 大数据的特征


  1.3 大数据的作用与具体应用


    1.3.1 大数据的作用


    1.3.2 大数据的应用


  1.4 大数据的技术与大数据的分析


    1.4.1 概述


    1.4.2 大数据的技术


    1.4.3 大数据的分析


    1.4.4 大数据现状


    1.4.5 展望大数据


第2章  Data Studio


  2.1 创建数据库


    2.1.1 命令方式创建数据库


    2.1.2 通过数据库向导来创建数据库


  2.2 创建数据库对象


    2.2.1 创建模式


    2.2.2 创建表空间


    2.2.3 创建缓冲池


    2.2.4 创建表


    2.2.5 创建索引


    2.2.6 创建视图


    2.2.7 创建别名


    2.2.8 创建约束


    2.2.9 创建触发器


  2.3 备份和恢复


    2.3.1 DB2数据库的备份


    2.3.2 DB2数据库的恢复


  2.4 DB2优化器


    2.4.1 优化器


    2.4.2 DB2优化器介绍


    2.4.3 SQL语句执行过程


    2.4.4 优化器组件和工作原理


    2.4.5 扫描方式


    2.4.6 连接方法


    2.4.7 优化级别


    2.4.8 如何影响优化器来提高性能


  2.5 SQL调优概述


    2.5.1 一般规则


    2.5.2 针对专门操作符的调优


第3章  数据库开发


  3.1 DB2与JDBC支持


  3.2 理解DB2 UDB JDBC通用驱动程序


    3.2.1 旧的JDBC驱动程序与新的通用JDBC驱动程序的比较


    3.2.2 诊断问题和分析跟踪


    3.2.3 JDBC通用驱动程序错误代码


第4章  集成数据管理


  4.1 集成数据管理简介


  4.2 数据建模和设计


    4.2.1 数据仓库设计和数据建模


    4.2.2 使用IBM InfoSphere Data Architect对DB2创建的全局临时表建模


  4.3 数据模型管理


    4.3.1 数据模型管理器


    4.3.2 规范


  4.4 主数据管理


    4.4.1 数据管理的范畴和主数据管理的概念


    4.4.2 主数据管理的意义


    4.4.3 主数据管理系统与数据仓库系统的关系


    4.4.4 主数据管理系统和ODS的关系


    4.4.5 主数据管理解决方案介绍


    4.4.6 企业主数据管理系统逻辑架构


  4.5 元数据管理


    4.5.1 明确元数据管理策略


    4.5.2 元数据集成体系结构


    4.5.3 实施元数据管理


  4.6 数据的交付


第5章  IBM InfoSphere软件


  5.1 InfoSphere Data Architect


    5.1.1 什么是IBM InfoSphere Data Architect


    5.1.2 下载DB2 Express-C


    5.1.3 安装InfoSphere Data Architect


  5.2 InfoSphere Streams


    5.2.1 安装流计算:一种新的计算模式


    5.2.2 InfoSphere Streams概述


    5.2.3 流处理语言


    5.2.4 开发环境


    5.2.5 BigInsights和InfoSphere Streams之间的集成和交互


    5.2.6 InfoSphere Streams环境


    5.2.7 InfoSphere Streams编程


    5.2.8 操作符和工具集


    5.2.9 InfoSphere Streams集成


    5.2.10 导航信息中心


  5.3 IBM InfoSphere BigInsights


    5.3.1 IBM InfoSphere BigInsights简介


    5.3.2 IBM InfoSphere BigInsights 3.0介绍


    5.3.3 IBM Big SQL 3.0


    5.3.4 企业集成


    5.3.5 GPFS File Place Optimizer


    5.3.6 IBM Adaptive MR


    5.3.7 IBM BigSheets


    5.3.8 高级文本分析


    5.3.9 Solr


    5.3.10 改进工作负载调度


    5.3.11 压缩


    5.3.12 总结


第6章  大数据环境下的安全与治理


  6.1 大数据环境下的信息安全


    6.1.1 信息安全的发展


    6.1.2 数据安全的概念


    6.1.3 大数据的特征


    6.1.4 大数据给信息安全带来新的挑战和机遇


  6.2 大数据面临的安全威胁


  6.3 大数据安全的应对策略


    6.3.1 大数据存储安全策略


    6.3.2 大数据应用安全策略


    6.3.3 大数据管理安全策略


  6.4 大数据的治理


    6.4.1 大数据环境下的安全技术体系框架


    6.4.2 大数据治理定义


    6.4.3 数据治理的作用


  6.5 大数据加密技术


第7章  Hadoop技术


  7.1 Hadoop简介


    7.1.1 简介


    7.1.2 Hadoop用途


  7.2 Hadoop安装与简单配置


    7.2.1 Linux安装


    7.2.2 JDK安装


    7.2.3 Hadoop下载


    7.2.4 Hadoop单机模式配置


    7.2.5 Hadoop伪分布模式配置


附录A


参考文献