当前,制造行业已从信息化进入到数字化、智能化的时代,工业大数据的价值在企业创新与变革 中日益受到重视。因此如何获得及时、可靠、准确的高质量数据是工业企业面临的一项重要工作。提升企业数据质量需要对企业数据进行治理,对数据 标准和质量的管理过程进行规范,这就要求企业基于国内外的相关标准和实践,建立数据治理体系和工具。
一、DCMM 数据管理成熟度模型
DCMM数据管理能力成熟度评估模型 (GB/T 36073-2018)是我国首个数据管理领域的国 家标准,由数据战略、数据治理、数据架构、数据 应用、数据安全、数据质量、数据标准和数据生存 周期 8 个能力域、28 个能力项、5 个能力成熟度等 级组成,其中的数据质量能力域是由数据质量需求、 数据质量检查、数据质量分析和数据质量提升 4 个 能力项构成数据质量管理的闭环。规范了数据从需 求、获取、存储、共享、维护、应用,至退役的生 命周期各个阶段质量问题的识别、度量、监控、预 警等一系列活动,为企业提高数据质量管理能力提 供了指导。
DCMM 贯标是提升数据治理能力的重要抓手。 2019 年 12 月,工业和信息化部委托中国电子信息 行业联合会牵头负责建立数据管理能力成熟度评估工作体系。截至 2023 年 2 月,中国电子信息行业联 合会已公示的获得 DCMM 等级证书的单位累计已有 900 多家,其中制造行业占比约 34%。
二、DCMM 的数据质量管理
DCMM 的数据质量管理能力域由数据质量需 求、数据质量检查、数据质量分析和数据质量提升 4 个能力项构成,是一个不断循环改进的过程。
DCMM 在数据质量管理能力域定义了 55 项能 力等级标准,企业可对照条款评估自身的数据管理 能力水平,明确提升的方向。
三、通过 DCMM 提升数据质量管理
DCMM 为数据治理提供了良好的模型支撑,工 业企业可通过对数据现状进行评估,结合 DCMM 模 型,形成符合自身特点的数据治理路径。在具体实 施中,企业可以从以下几方面落地。
(一)数据质量管理制度
在企业组织层面制定全面的数据质量管理制度,使数据质量管理各项活动有章可循,可从下面三个方面完善数据质量管理制度,并在执行过程中 根据实际情况不断修订和完善。
(二)数据质量管理团队
成立跨部门的复合型数据质量管理团队,明确各类数据管理人员及其相关职责 , 建立数据认责机制,明确数据所有者、治理者和使用者。建立统一的数据质量责任体系,明确数据质量责任人员考核的范围和目标。
(三)数据质量管理方法和工具
1. 费用效益分析:通过费用效益分析,梳理各 类数据的优先级和质量评价指标。
2. 质量问题评估方法:使用根本原因分析(Root Cause Analysis)方法,从四个方面(信息、技术、 流程、管理)进行结构化分析。
3. 使用工作模板:如数据质量需求模板、数据 质量规则模板、数据质量剖析模板、数据质量问题 模板、数据质量报告模板等。使用工作模板可以提 高团队工作能力和效率。
4. 完善元数据管理:定义数据质量需要元数据, 良好的元数据管理能为数据质量管理的采集、监控、 分析、改进,提供高效、有力的保障,同时好的数据质量管理也能促进元数据管理的持续改进。
5. 使用工具平台系统:在数据质量管理过程中使用自动化的工具平台,数据质量管理平台的基本功能应包括:数据质量规则设计、规则库管理、元数据管理、数据剖析、任务管理、异常数据分析、 数据质量报告。
6. 对设备感知数据的数据采集问题,采取针对性的质量控制方法,例如:使用新设备、升级通信协议、优化传输环境、使用特定算法进行数据补偿。
7. 持续改进:数据质量管理不是一劳永逸的工 作,企业一方面需要对使用中的数据质量进行定期 检查和校正,另一方面外部环境的变化和工业企业自身的进步(新产品、技改、市场拓展等), 也会对已有的数据质量标准提出更高的要求。因此,数据质量活动是一个持续不断的计划、检查、分析、提 升(PDCA)循环过程。
(四)数据质量文化建设
在数据质量管理过程中对产生的信息进行知识 总结,建立数据质量知识库,提升团队的数据质量管理能力;建立数据质量分析案例库,持续开展数据质量相关的培训和宣传,打造良好的组织数据质量文化氛围;参与行业交流,学习行业最佳实践。
四、结语
数据质量管理贯穿了数据生存周期的全过程, 是一项长期、持续改进的工作。DCMM 为数据质量管理提供了良好的模型支撑和过程指引,工业企业可参照 DCMM模型,对数据生存周期每个阶段可能出现的质量问题进行识别、度量、监控和预警等一系列管理活动,建立持续改进的数据质量管理体系。