数据挖掘:方法与应用-应用案例 / 清华大学计算机系列教材
¥19.00定价
作者: 徐华
出版时间:2017年7月
出版社:清华大学出版社
- 清华大学出版社
- 9787302472117
- 1-1
- 116564
- 32开
- 2017年7月
- 工学
- 软件工程
- TP311.13
- 计算机
- 本专科、高职高专
内容简介
本书主要以作者近五年在清华大学开展数据挖掘应用研究和教学工作为基础,从所指导的多个数据挖掘与分析的应用案例中精选出包括交通、体育、金融、生物信息、社交网络、电力等领域代表性的数据挖掘与分析案例,结合基本的数据挖掘应用实施思路,展示了在不同行业领域开展数据挖掘与分析工作的实际过程。
本书可作为高等院校学生学习数据挖掘的参考读物,同时可供工程技术人员开展数据挖掘与分析工作时参考。
本书可作为高等院校学生学习数据挖掘的参考读物,同时可供工程技术人员开展数据挖掘与分析工作时参考。
目录
目录
第1章绪论1
1.1本书背景1
1.2数据挖掘应用概述2
1.3本书的主要内容安排4
1.4小结5
第2章基于GPS信息的出租车行车轨迹数据挖掘6
2.1概述6
2.2出租车GPS数据挖掘问题描述6
2.3基于GPS数据的出租车轨迹挖掘与分析9
2.4挖掘任务点评30
2.5小结31
第3章NBA比赛结果预测32
3.1问题背景32
3.2数据采集33
3.2.1数据来源33
3.2.2数据采集方法33
3.2.3原始数据34
3.3挖掘方法36
3.3.1挖掘的目标与实现思路36
3.3.2预测特征选取37
3.4分类和预测方法38
3.5预测结果的分析和对比39
3.5.1使用球队平均数据预测比赛结果39
3.5.2使用球队近期数据预测比赛结果40
3.6挖掘任务点评43
3.7小结43
参考文献44
第4章大型商业银行后台运维数据故障分析46
4.1概述46
4.1.1应用背景46
4.1.2主要研发内容49
4.2相关方法回顾51
4.2.1主成分分析法51
4.2.2前向特征选择法52
4.2.3随机森林方法52
4.3交易超时故障预测方法设计与实现54
4.3.1问题定义54
4.3.2工作流程55
4.3.3数据预处理55
4.3.4降维处理61
4.3.5预测模型62
4.3.6防范模型63
4.3.7评价方法64
4.4综合系统的设计与实现65
4.4.1系统框架65
4.4.2数据预处理模块65
4.4.3随机森林模块66
4.4.4展示模块67
4.4.5最终效果模块67
4.5结果分析与评价69
4.5.1实验数据69
4.5.2交易故障预测相关实验70
4.6挖掘任务点评75
4.7小结76
4.7.1总结76
4.7.2展望77
参考文献77
第5章RNA排序预测80
5.1概述80
5.2研发现状81
5.2.1内部核糖体进入位点的数据
挖掘研发现状81
5.2.2冷冻电镜图像蛋白质颗粒挑选
研究现状84
5.3工作设计与实现86
5.3.1基本的设计框架与实现思路86
5.3.2核心挖掘模型设计与实现91
5.4应用实现94
5.4.1实现程序与功能94
5.4.2数据挖掘分析结果展示95
5.5操作说明98
5.6挖掘任务点评98
5.7小结99
参考文献100
第6章”乐学”微信公众号关注趋势分析101
6.1前言101
6.1.1研究背景101
6.1.2数据来源102
6.1.3数据预处理102
6.1.4研究思路103
6.2平台发展现状104
6.2.1平台用户特性105
6.2.2平台传播状态108
6.2.3便捷操作发展状况113
6.3推送发展模式探究119
6.3.1成功推送案例分析120
6.3.2理想发展模式探究123
6.3.3不同模式下的平台关注量预测123
6.3.4推送发展的改进思路126
6.4便捷操作功能探究127
6.4.1用户使用习惯分析127
6.4.2便捷操作功能的改进思路128
6.5挖掘任务点评129
6.6小结130
参考文献130
第7章保险行业客户特征识别131
7.1概述131
7.2数据挖掘问题描述133
7.2.1问题背景133
7.2.2关于数据集133
7.3保险客户特征识别与分析134
7.3.1数据预处理134
7.3.2挖掘与分析结果145
7.4挖掘任务点评148
7.5小结150
参考文献150
第8章电力系统不良数据辨识案例分析155
8.1概述155
8.1.1电力系统不良数据辨识155
8.1.2数据介绍156
8.2研究内容157
8.2.1基于GSA的kmeans聚类157
8.2.2基于有效指数的kmeans聚类164
8.2.3模糊Cmeans聚类168
8.3总结分析171
8.3.1不良数据辨识结果对比171
8.3.2不良数据分析173
8.4挖掘任务点评175
8.5小结175
第9章总结177
第1章绪论1
1.1本书背景1
1.2数据挖掘应用概述2
1.3本书的主要内容安排4
1.4小结5
第2章基于GPS信息的出租车行车轨迹数据挖掘6
2.1概述6
2.2出租车GPS数据挖掘问题描述6
2.3基于GPS数据的出租车轨迹挖掘与分析9
2.4挖掘任务点评30
2.5小结31
第3章NBA比赛结果预测32
3.1问题背景32
3.2数据采集33
3.2.1数据来源33
3.2.2数据采集方法33
3.2.3原始数据34
3.3挖掘方法36
3.3.1挖掘的目标与实现思路36
3.3.2预测特征选取37
3.4分类和预测方法38
3.5预测结果的分析和对比39
3.5.1使用球队平均数据预测比赛结果39
3.5.2使用球队近期数据预测比赛结果40
3.6挖掘任务点评43
3.7小结43
参考文献44
第4章大型商业银行后台运维数据故障分析46
4.1概述46
4.1.1应用背景46
4.1.2主要研发内容49
4.2相关方法回顾51
4.2.1主成分分析法51
4.2.2前向特征选择法52
4.2.3随机森林方法52
4.3交易超时故障预测方法设计与实现54
4.3.1问题定义54
4.3.2工作流程55
4.3.3数据预处理55
4.3.4降维处理61
4.3.5预测模型62
4.3.6防范模型63
4.3.7评价方法64
4.4综合系统的设计与实现65
4.4.1系统框架65
4.4.2数据预处理模块65
4.4.3随机森林模块66
4.4.4展示模块67
4.4.5最终效果模块67
4.5结果分析与评价69
4.5.1实验数据69
4.5.2交易故障预测相关实验70
4.6挖掘任务点评75
4.7小结76
4.7.1总结76
4.7.2展望77
参考文献77
第5章RNA排序预测80
5.1概述80
5.2研发现状81
5.2.1内部核糖体进入位点的数据
挖掘研发现状81
5.2.2冷冻电镜图像蛋白质颗粒挑选
研究现状84
5.3工作设计与实现86
5.3.1基本的设计框架与实现思路86
5.3.2核心挖掘模型设计与实现91
5.4应用实现94
5.4.1实现程序与功能94
5.4.2数据挖掘分析结果展示95
5.5操作说明98
5.6挖掘任务点评98
5.7小结99
参考文献100
第6章”乐学”微信公众号关注趋势分析101
6.1前言101
6.1.1研究背景101
6.1.2数据来源102
6.1.3数据预处理102
6.1.4研究思路103
6.2平台发展现状104
6.2.1平台用户特性105
6.2.2平台传播状态108
6.2.3便捷操作发展状况113
6.3推送发展模式探究119
6.3.1成功推送案例分析120
6.3.2理想发展模式探究123
6.3.3不同模式下的平台关注量预测123
6.3.4推送发展的改进思路126
6.4便捷操作功能探究127
6.4.1用户使用习惯分析127
6.4.2便捷操作功能的改进思路128
6.5挖掘任务点评129
6.6小结130
参考文献130
第7章保险行业客户特征识别131
7.1概述131
7.2数据挖掘问题描述133
7.2.1问题背景133
7.2.2关于数据集133
7.3保险客户特征识别与分析134
7.3.1数据预处理134
7.3.2挖掘与分析结果145
7.4挖掘任务点评148
7.5小结150
参考文献150
第8章电力系统不良数据辨识案例分析155
8.1概述155
8.1.1电力系统不良数据辨识155
8.1.2数据介绍156
8.2研究内容157
8.2.1基于GSA的kmeans聚类157
8.2.2基于有效指数的kmeans聚类164
8.2.3模糊Cmeans聚类168
8.3总结分析171
8.3.1不良数据辨识结果对比171
8.3.2不良数据分析173
8.4挖掘任务点评175
8.5小结175
第9章总结177