数据仓库与数据挖掘技术 / 高等院校信息管理与信息系统专业系列教材
¥29.50定价
作者: 孙水华、赵钊林等
出版时间:2015年2月
出版社:清华大学出版社
- 清华大学出版社
- 9787302281665
- 1-2
- 188164
- 16开
- 2015年2月
- 工学
- 计算机科学与技术
- TP393.08
- 计算机
- 本专科、高职高专
内容简介
《数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。全书共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。本书各章节的案例均使用microsoftsql server2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。
《数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
目录
第1章 数据仓库与数据挖掘概述1.1 数据仓库的产生与发展1.1.1 数据仓库的产生1.1.2 数据仓库的发展1.1.3 数据仓库的研究与开发现状1.1.4 数据仓库的作用1.2 数据仓库的基本概念1.2.1 数据仓库的定义与基本特性1.2.2 数据仓库与数据库的区别1.2.3 数据仓库数据的组织架构1.3 数据仓库的体系结构1.3.1 虚拟的数据仓库体系结构1.3.2 单独的数据仓库体系结构1.3.3 单独的数据集市体系结构1.3.4 分布式数据仓库结构1.4 数据仓库的相关概念1.4.1 数据源1.4.2 数据的存储层1.4.3 olap服务器1.4.4 前端工具1.5 数据挖掘技术概述1.5.1 数据挖掘技术产生的背景1.5.2 数据挖掘的基本概念1.5.3 数据挖掘的对象1.5.4 数据挖掘功能1.5.5 数据挖掘与传统分析方法的区别1.5.6 数据仓库与数据挖掘的关系1.5.7 数据挖掘的发展趋势1.6 数据挖掘过程1.6.1 fayyad过程模型1.6.2 crisp-dm过程模型1.6.3 其他数据挖掘过程模型1.7 常用的数据挖掘技术1.8 小结1.9 习题第2章 数据仓库开发模型2.1 数据仓库开发模型概述2.2 数据仓库的概念模型2.2.1 企业模型的建立2.2.2 规范的数据模型2.2.3 常见的概念模型2.3 数据仓库的逻辑模型2.3.1 事实表模型设计2.3.2 维度表模型设计2.4 数据仓库的物理模型2.4.1 物理模型的设计要点2.4.2 数据仓库物理模型的存储结构2.4.3 数据仓库物理模型的索引构建2.4.4 数据仓库物理模型的优化问题2.5 数据仓库的元数据模型2.5.1 元数据的类型2.5.2 元数据的作用2.5.3 元数据的收集与维护2.5.4 元数据的使用2.5.5 元数据管理模型2.6 数据仓库的粒度和聚集模型2.6.1 数据仓库粒度模型2.6.2 数据仓库聚集模型与数据分割2.7 小结2.8 习题第3章 etl技术3.1 etl相关概念3.1.1 数据理解3.1.2 数据抽取3.1.3 数据清洗3.1.4 数据转换3.1.5 数据加载3.2 etl过程建模3.2.1 etl系统面临的挑战3.2.2 etl过程描述3.2.3 etl概念模型3.2.4 etl逻辑模型3.3 etl增量抽取机制3.4 etl过程数据质量控制3.4.1 数据质量问题分类3.4.2 数据质量控制技术3.5 etl并行处理技术3.6 小结3.7 习题第4章 olap技术4.1 olap概述4.1.1 olap的定义4.1.2 数据仓库与数据分析的关系4.1.3 多维分析的基本概念4.1.4 olap的多维数据分析4.1.5 olap与oltp的比较4.2 多维数据库及其存储4.2.1 多维数据库4.2.2 多维数据库的数据存储4.2.3 多维数据库与数据仓库4.3 olap的类型4.3.1 多维olap4.3.2 关系olap4.3.3 混合型olap4.3.4 molap与rolap的比较4.4 olap的体系结构4.5 olap中的索引技术4.5.1 b-tree索引4.5.2 位图索引4.5.3 位图索引的扩展--标识符索引4.5.4 索引性能比较4.5.5 索引的选择4.6 olap的评价标准4.6.1 olap的衡量标准4.6.2 olap服务器和工具的评价标准4.7 olap的前端展现4.7.1 olap工具4.7.2 olap结果的展现方法4.8 小结4.9 习题第5章 商务智能系统5.1 商务智能概述5.1.1 商务智能的概念5.1.2 商务智能的发展历程5.1.3 商务智能的商业效益5.2 商务智能系统架构5.2.1 商务智能系统的核心技术5.2.1 商务智能的体系结构5.3 商务智能系统的功能5.4 商务智能系统的应用5.4.1 商务智能系统特点5.4.2 我国商务智能系统应用现状分析5.5 小结5.6 习题第6章 数据预处理技术6.1 数据预处理概述6.1.1 数据预处理的必要性6.1.2 数据预处理的基本方法6.1.3 数据预处理的研究现状6.2 数据清理6.2.1 填充缺失值6.2.2 光滑噪声数据6.2.3 数据清理过程6.3 数据集成6.4 数据变换6.5 数据归约6.5.1 数据立方体聚集6.5.2 属性子集选择6.5.3 维度归约6.5.4 数值归约6.5.5 数据离散化与概念分层6.6 小结6.7 习题第7章 数据挖掘技术7.1 概念描述7.1.1 概念描述的生成过程7.1.2 概念分层与数据泛化7.1.3 概念分层方法7.1.4 数据泛化方法7.1.5 泛化的表示7.1.6 属性相关分析7.1.7 区别性描述7.2 关联规则7.2.1 关联规则相关概念7.2.2 关联规则挖掘步骤7.2.3 关联规则分类7.2.4 关联规则的算法7.3 数据分类7.3.1 数据分类的基本步骤与评价准则7.3.2 决策树7.3.3 贝叶斯分类7.3.4 神经网络方法7.3.5 近邻分类方法7.4 数据聚类7.4.1 聚类分析概述7.4.2 聚类算法的分类及其典型算法7.4.3 聚类分析中的相似度度量方法7.4.4 聚类分析中的聚类准则函数7.4.5 k-means聚类算法7.5 遗传算法7.5.1 遗传算法的基本术语7.5.2 遗传算法的执行过程7.5.3 遗传算法应用举例7.5.4 遗传算法的基本要素7.5.5 遗传算法的特点及应用领域7.6 粗糙集7.6.1 粗糙集理论的相关概念7.6.2 粗糙集的应用举例7.6.3 粗糙集理论研究的对象及特点7.7 小结7.8 习题第8章 数据仓库开发实例8.1 sql server 2005所提供的数据仓库功能8.1.1 sql server 2005 integration services8.1.2 sql server 2005 analysis services8.1.3 sql server 2005 dw工具8.2 福马特商店销售分析数据仓库系统的分析与设计8.3 数据仓库的实现8.3.1 sql server的数据仓库创建8.3.2 olap的实施8.3.3 数据仓库中的数据挖掘8.4 数据仓库的应用与管理8.4.1 数据仓库的用户8.4.2 数据仓库应用案例8.4.3 数据仓库的运行技术管理8.4.4 数据仓库应用中的法律问题8.4.5 数据仓库的成本与效益分析8.5 小结8.6 习题第9章 报表设计9.1 报表概述9.1.1 报表结构9.1.2 传递报表9.1.3 report server功能结构9.1.4 report services的组成部分9.2 报表向导制作报表9.2.1 向导制作报表9.2.2 报表设计器9.2.3 部署报表9.3 编辑制作报表9.3.1 新建报表项目9.3.2 新建数据集9.3.3 报表格式设计9.3.4 分组9.3.5 钻取功能9.3.6 文档结构图9.4 矩阵式报表9.4.1 数据集建立9.4.2 矩阵布局9.4.3 矩形布局9.4.4 折叠结构9.5 统计图表9.5.1 图表元素9.5.2 柱形图9.5.3 折线图9.5.4 饼图9.5.5 圆环图9.6 主体的多列9.7 小结9.8 实验参考文献