数据仓库与数据挖掘 / 计算机科学与技术学科研究生教材
¥39.00定价
作者: 李雄飞、杜钦生
出版时间:2013年7月
出版社:机械工业出版社
- 机械工业出版社
- 9787111436751
- 1-1
- 125199
- 45188596-6
- 16开
- 2013年7月
- 259
- 工学
- 计算机科学与技术
- TP274
- 计算机通信类
- 本科
内容简介
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。
《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。
《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
目录
《数据仓库与数据挖掘》
前言
教学建议
第1章绪论
1.1引言
1.2数据仓库
1.2.1从数据库到数据仓库
1.2.2数据仓库的基本概念
1.2.3数据仓库的体系结构
1.3数据挖掘
1.3.1 kdd与数据挖掘
1.3.2数据库与数据挖掘发展历程
1.3.3数据挖掘的特征与对象
1.3.4数据挖掘相关领域
1.4数据仓库与数据挖掘的关系
1.5应用前景与发展趋势
本章小结
习题
第2章联机分析处理
2.1引言
2.2 olap的定义
2.3 olap的相关概念
2.4 olap与oltp的关系和比较
2.5 olap准则
2.6多维数据分析方法
2.7关系数据的组织
2.8多维数据的存储方式
2.9 olap体系结构
2.10 olap的展现方式
2.11 olap工具的评价指标
2.12 olap的局限性
本章小结
习题
第3章数据仓库的设计与开发
3.1引言
3.2数据仓库的数据模型概述
3.3数据仓库的分析与设计
3.3.1需求分析
3.3.2概念模型设计
3.3.3逻辑模型设计
3.3.4物理模型设计
3.3.5数据仓库的索引技术
3.4数据仓库的开发
3.4.1风险因素
3.4.2数据仓库系统的生命周期
3.4.3建立数据仓库系统的思维模式
3.4.4数据仓库数据库的设计步骤
3.4.5数据质量与数据清洗
3.4.6数据粒度与维度建模
3.4.7选择数据仓库工具
3.4.8提高数据仓库性能
3.4.9数据仓库的安全性
3.5主要的数据仓库产品
本章小结
习题
第4章关联规则
4.1引言
4.2关联规则模型
4.3 apriori算法
4.3.1发现频繁项集
4.3.2生成关联规则
4.4频繁模式增长算法
4.4.1建树方法
4.4.2用fp树挖掘频繁模式
4.5关联规则模型扩展
4.5.1多级关联规则
4.5.2多维关联规则
本章小结
习题
第5章粗糙集
5.1引言
5.2近似空间
5.2.1近似空间与不可分辨关系
5.2.2知识与知识库
5.3近似与粗糙集
5.3.1基本概念
5.3.2基本性质
5.4描述粗糙集的特征的方法
5.4.1近似精度
5.4.2拓扑特征
5.5信息系统
5.5.1信息系统的定义
5.5.2约简和核
5.5.3分辨矩阵与分辨函数
5.5.4信息系统约简
5.6决策表
5.6.1相对约简与知识依赖性
5.6.2决策表及其约简
5.6.3近似约简算法
5.6.4决策规则
本章小结
习题
第6章决策树
6.1引言
6.2构建决策树的理论问题
6.2.1为当前结点选择属性
6.2.2过拟合问题
6.3 id3算法
6.3.1生成决策树的算法
6.3.2生成规则和决策
6.4决策树的剪枝
6.4.1预剪枝
6.4.2后剪枝
6.5 c4.5算法
本章小结
习题6
第7章聚类分析
7.1引言
7.2聚类分析简介
7.2.1聚类分析
7.2.2聚类分析应用领域与算法特征
7.3数据类型、距离和相似系数
7.3.1数据类型
7.3.2距离和相似系数
7.4聚类方法与聚类分类
7.4.1聚类方法
7.4.2聚类方法的分类
7.5划分方法
7.5.1 k-均值算法
7.5.2 k-中心点算法
7.5.3关于参数k
7.5.4 em聚类
7.6层次方法
7.6.1层次聚类中的距离度量
7.6.2分裂方法
7.6.3凝聚方法
7.7基于密度的方法
7.7.1 dbscan算法
7.7.2矢量感应聚类算法
7.8聚类评估
7.8.1假设检验
7.8.2聚类评估中的假设检验
7.8.3相对准则
本章小结
习题7
第8章兴趣度量
8.1引言
8.2用于关联规则和分类规则的度量
8.2.1客观度量
8.2.2主观度量
8.2.3语义度量
8.3用于总结的度量
8.4分类器的兴趣度
本章小结
习题8
第9章应用案例
9.1数据仓库应用案例
9.1.1案例一:网络购物数据仓库
9.1.2案例二:社会保障卡数据仓库
9.1.3案例三:医院信息系统数据仓库
9.2数据挖掘应用案例
9.2.1案例一:零售商系统货篮数据挖掘
9.2.2案例二:通信用户满意度指数评测
9.2.3案例三:城市环境质量评价
本章小结
参考文献
前言
教学建议
第1章绪论
1.1引言
1.2数据仓库
1.2.1从数据库到数据仓库
1.2.2数据仓库的基本概念
1.2.3数据仓库的体系结构
1.3数据挖掘
1.3.1 kdd与数据挖掘
1.3.2数据库与数据挖掘发展历程
1.3.3数据挖掘的特征与对象
1.3.4数据挖掘相关领域
1.4数据仓库与数据挖掘的关系
1.5应用前景与发展趋势
本章小结
习题
第2章联机分析处理
2.1引言
2.2 olap的定义
2.3 olap的相关概念
2.4 olap与oltp的关系和比较
2.5 olap准则
2.6多维数据分析方法
2.7关系数据的组织
2.8多维数据的存储方式
2.9 olap体系结构
2.10 olap的展现方式
2.11 olap工具的评价指标
2.12 olap的局限性
本章小结
习题
第3章数据仓库的设计与开发
3.1引言
3.2数据仓库的数据模型概述
3.3数据仓库的分析与设计
3.3.1需求分析
3.3.2概念模型设计
3.3.3逻辑模型设计
3.3.4物理模型设计
3.3.5数据仓库的索引技术
3.4数据仓库的开发
3.4.1风险因素
3.4.2数据仓库系统的生命周期
3.4.3建立数据仓库系统的思维模式
3.4.4数据仓库数据库的设计步骤
3.4.5数据质量与数据清洗
3.4.6数据粒度与维度建模
3.4.7选择数据仓库工具
3.4.8提高数据仓库性能
3.4.9数据仓库的安全性
3.5主要的数据仓库产品
本章小结
习题
第4章关联规则
4.1引言
4.2关联规则模型
4.3 apriori算法
4.3.1发现频繁项集
4.3.2生成关联规则
4.4频繁模式增长算法
4.4.1建树方法
4.4.2用fp树挖掘频繁模式
4.5关联规则模型扩展
4.5.1多级关联规则
4.5.2多维关联规则
本章小结
习题
第5章粗糙集
5.1引言
5.2近似空间
5.2.1近似空间与不可分辨关系
5.2.2知识与知识库
5.3近似与粗糙集
5.3.1基本概念
5.3.2基本性质
5.4描述粗糙集的特征的方法
5.4.1近似精度
5.4.2拓扑特征
5.5信息系统
5.5.1信息系统的定义
5.5.2约简和核
5.5.3分辨矩阵与分辨函数
5.5.4信息系统约简
5.6决策表
5.6.1相对约简与知识依赖性
5.6.2决策表及其约简
5.6.3近似约简算法
5.6.4决策规则
本章小结
习题
第6章决策树
6.1引言
6.2构建决策树的理论问题
6.2.1为当前结点选择属性
6.2.2过拟合问题
6.3 id3算法
6.3.1生成决策树的算法
6.3.2生成规则和决策
6.4决策树的剪枝
6.4.1预剪枝
6.4.2后剪枝
6.5 c4.5算法
本章小结
习题6
第7章聚类分析
7.1引言
7.2聚类分析简介
7.2.1聚类分析
7.2.2聚类分析应用领域与算法特征
7.3数据类型、距离和相似系数
7.3.1数据类型
7.3.2距离和相似系数
7.4聚类方法与聚类分类
7.4.1聚类方法
7.4.2聚类方法的分类
7.5划分方法
7.5.1 k-均值算法
7.5.2 k-中心点算法
7.5.3关于参数k
7.5.4 em聚类
7.6层次方法
7.6.1层次聚类中的距离度量
7.6.2分裂方法
7.6.3凝聚方法
7.7基于密度的方法
7.7.1 dbscan算法
7.7.2矢量感应聚类算法
7.8聚类评估
7.8.1假设检验
7.8.2聚类评估中的假设检验
7.8.3相对准则
本章小结
习题7
第8章兴趣度量
8.1引言
8.2用于关联规则和分类规则的度量
8.2.1客观度量
8.2.2主观度量
8.2.3语义度量
8.3用于总结的度量
8.4分类器的兴趣度
本章小结
习题8
第9章应用案例
9.1数据仓库应用案例
9.1.1案例一:网络购物数据仓库
9.1.2案例二:社会保障卡数据仓库
9.1.3案例三:医院信息系统数据仓库
9.2数据挖掘应用案例
9.2.1案例一:零售商系统货篮数据挖掘
9.2.2案例二:通信用户满意度指数评测
9.2.3案例三:城市环境质量评价
本章小结
参考文献