数据质量改进实践指南(精) / 大数据治理与应用丛书
作者: (美)洛申
译者:曹建军,江春 译;
出版时间:2016年8月
出版社:国防工业出版社
- 国防工业出版社
- 9787118108132
- 52217
- 2016年8月
- 未分类
- 未分类
- TP274
业务问题与不合格的数据质量期望指数直接相关。有缺陷的信息生产过程造成了阻碍关键业务目标成功实现的风险。通过数据质量管理与控制能够消除这些缺陷:从始至终控制信息、生产过程的质量,以确保在产生实际影响前,对缺陷做到早发现,并按优先次序修复。洛申著的《数据质量改进实践指南(精)》分享了理解低劣数据质量影响的基本原则,并指导管理者和实践者以相同的方式交流、获得支持、规划和建立数据质量计划。本书给业务影响分析、数据质量指标定义、检查和监测、修复以及数据质量工具的使用提供了模板和流程。本书讨论的复杂难解问题,给实际工作提供了有价值的建议。
本书特点包括:
(1)阐明了如何制定和执行数据质量计划,从初步想法与表述到维护与持续性度量。
(2)研究了数据质量工具的使用,包括业务案例模板,以及分析、报告与战略规划工具。
(3)综合评判了业务层和IT层数据质量,包括其中的人员、过程与技术。
本书内容丰富,可操作性强,可作为数据资源建设与利用、信息技术等领域科研和工程技术人员的参考用书。
第1章 低劣数据质量的业务影响
1.1 信息价值与数据质量改进
1.2 业务期望指数与数据质量
1.3 减轻影响
1.4 若干实例
1.5 影响分类的进一步讨论
1.6 业务影响分析
1.7 其他影响类别
1.8 影响分类系统和迭代改进
1.9 小结:将影响转化为绩效
第2章 组织的数据质量计划
2.1 数据质量的良性循环
2.2 数据质量流程
2.3 利益相关者和参与者
2.4 数据质量工具
2.5 小结
第3章 数据质量成熟度
3.1 数据质量战略
3.2 数据质量框架
3.3 数据质量能力/成熟度模型
3.4 框架组件与成熟度模型的映射
3.5 小结
第4章 企业行动整合
4.1 规划行动
4.2 框架行动
4.3 操作和应用行动
4.4 范围问题
4.5 小结
第5章 建立业务案例和数据质量路线图
5.1 数据质量投资回报
5.2 建立业务案例
5.3 发现业务影响
5.4 研究成本
5.5 关联影响与原因
5.6 影响矩阵
5.7 问题、问题要点和原因
5.8 关联影响与数据缺陷
5.9 估算价值差距
5.10 划分优先级行动
5.11 数据质量路线图
5.12 建立路线图的实际步骤
5.13 责任、职责和管理
5.14 数据质量计划的生命周期
5.15 小结
第6章 度量指标和绩效改进
6.1 面向绩效的数据质量
6.2 建立数据质量度量指标
6.3 测量和关键数据质量绩效指标
6.4 统计过程控制
6.5 控制图
6.6 多种控制图
6.7 控制图说明
6.8 查找特殊原因
6.9 维护控制
6.10 小结
第7章 数据治理
7.1 企业数据质量论坛
7.2 数据质量章程
7.3 任务和指导原则
7.4 角色和职责
7.5 运营结构调整优化
7.6 数据统管
7.7 数据质量验证和认证
7.8 问题和解决方案
7.9 数据治理和联合社团
7.10 小结
第8章 数据质量维度
8.1 什么是数据质量维度
8.2 维度类别
8.3 数据质量维度描述
8.4 内在维度
8.5 上下文维度
8.6 定性维度
8.7 找出自己的维度
8.8 小结
第9章 数据需求分析
9.1 信息的企业用途和业务证析
9.2 业务驱动和数据依赖关系
9.3 什么是数据需求分析
9.4 数据需求分析流程
9.5 定义数据质量规则
9.6 小结
第10章 元数据与数据标准
10.1 挑战
10.2 数据标准
10.3 元数据管理
10.4 业务定义
10.5 参考元数据
10.6 数据元
10.7 业务元数据
10.8 数据协调流程
10.9 小结
第11章 数据质量评价
11.1 规划
11.2 业务流程评估
11.3 准备和数据分析
11.4 数据剖析和分析
11.5 分析结果的综合
11.6 企业客户审查
11.7 快速数据评价小结——明确的结果
第12章 修复和改进计划
12.1 按性质分类
12.2 信息流图
12.3 根本原因分析
12.4 修复
12.5 执行
12.6 小结
第13章 数据质量服务水平协议
13.1 业务驱动和成功准则
13.2 识别数据质量规则
13.3 建立数据质量控制
13.4 数据质量服务水平协议
13.5 检查和监测
13.6 数据质量度量指标和数据质量记分卡
13.7 数据质量事件报告和跟踪
13.8 自动化指标汇集
13.9 记分卡报告
13.10 采取修复行动
13.11 小结——管理使用数据质量记分卡
第14章 数据剖析
14.1 数据剖析的应用环境
14.2 数据剖析:算法技术
14.3 数据逆向工程
14.4 异常分析
14.5 数据质量规则发现
14.6 元数据合规性和数据模型完整性
14.7 协调参与者
14.8 选择分析数据集
14.9 小结
第15章 解析和标准化
15.1 数据错误范例
15.2 元数据的作用
15.3 标记:含义的单位
15.4 解析
15.5 标准化
15.6 定义规则和转换建议
15.7 主动与被动的矛盾
15.8 将数据转换整合进应用框架
15.9 小结
第16章 实体身份分辨
16.1 数据纠正的诱因
16.2 唯一身份的双重挑战
16.3 什么是实体
16.4 识别属性
16.5 相似度分析和匹配流程
16.6 匹配算法
16.7 虚报、漏报和阈值设定
16.8 保留
16.9 链接和保留监测
16.10 实体搜索与匹配和计算复杂度
16.11 身份分辨的应用
16.12 业务需求评估
16.13 小结
第17章 检查、监测、审核和跟踪
17.1 再谈数据质量服务水平协议
17.2 实行检查和监测:技术与流程
17.3 数据质量业务规则
17.4 自动检查和监测
17.5 事故报告、通知和问题管理
17.6 小结
第18章 数据增强
18.1 增强的价值
18.2 数据增强方法
18.3 数据增强的实例
18.4 通过标准化增强
18.5 通过上下文增强
18.6 通过数据合并增强
18.7 小结:符合规定的增强数据源
第19章 主数据管理和数据质量
19.1 什么是主数据
19.2 什么是主数据管理
19.3 “黄金记录”或“统一视图”
19.4 作为工具的主数据管理
19.5 主数据管理:一种高层组件方法
19.6 主数据使用场景
19.7 主数据管理架构
19.8 识别主数据
19.9 主数据服务
19.10 小结:走近主数据管理和数据质量
第20章 全书总结
20.1 组织和管理
20.2 建立信息质量计划
20.3 技术和工具
20.4 小结
索引