注册 登录 进入教材巡展
#
  • #

出版时间:2016年7月

出版社:中国人民大学出版社

以下为《大数据挖掘与统计机器学习》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国人民大学出版社
  • 9787300231013
  • 141300
  • 0045178607-3
  • 16开
  • 2016年7月
  • 356
  • 工学
  • 计算机科学与技术
  • TP274
  • 统计、经管
  • 研究生、本科
内容简介
吕晓玲、宋捷主编的《大数据挖掘与统计机器学习》介绍数据挖掘与统计机器学习领域常用的模型和算法,包括基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。最后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,本书给出了每种方法的R语言实现,以及应用Python语言实现深度学习和支持向量机两种方法。本书的一个亮点是最后一章给出的两个大数据案例,数据量均在10G左右。本书同时给出了单机版(Python、数据库、R)和分布式(Hadoop、Hive、Spark)两种实现方案。原始数据和程序代码均可在出版社提供的网址下载。
本书面向的主要读者是应用统计专业硕士,希望能够拓展到统计专业高年级的本科生以及其他各个领域有数据分析需求的学生和从业人员。
目录

第1章  概述


  1.1 名词演化


  1.2 基本内容


  1.3 数据智慧


第2章  线性回归方法


  2.1 多元线性回归


  2.2 压缩方法:岭回归与Lasso


  2.3 *Lasso 模型的求解与理论性质


  2.4 损失函数加罚的建模框架


  2.5 上机实践


第3章  线性分类方法


  3.1 分类问题综述与评价准则


  3.2 Logistic回归


  3.3 线性判别


  3.4 上机实践


第4章  模型评价与选择


  4.1 基本概念


  4.2 *理论方法


  4.3 数据重利用方法


  4.4 上机实践


第5章  决策树与组合方法


  5.1 决策树


  5.2 Bagging


  5.3 Boosting


  5.4 随机森林


  5.5 上机实践


第6章  神经网络与深度学习


  6.1 神经网络


  6.2 深度学习


  6.3 上机实践


第7章  支持向量机


  7.1 线性可分支持向量机


  7.2 软间隔支持向量机


  7.3 一些拓展


  7.4 上机实践


第8章  聚类分析


  8.1 基于距离的聚类


  8.2 基于模型和密度的聚类


  8.3 稀疏聚类


  8.4 双向聚类


  8.5 上机实践


第9章  推荐系统


  9.1 基于邻居的推荐


  9.2 潜在因子与矩阵分解算法


  9.3 上机实践


第10章  大数据案例分析


  10.1 智能手机用户监测数据案例分析


  10.2 美国航空数据案例分析


参考文献