在一个真正的数据驱动型企业,企业应拥有一套闭环的数据价值体系。数据价值体系指的是一套完整的从数据采集、整理、报告到创造价值的流程。
从人类驱动各类行为的路径出发,可以思考数据驱动的作用过程,从而对数据价值体系的全貌进行阐释。首先,人体全面感知周围的信息;其次,大脑对基于感官采集的各类信息进行加工分析、洞察决策;再次,在选择好执行方案后,协调手足、语言等开展执行;从次,在执行过程中随时对执行情况进行监控、分析和评价,及时做出改进;最后,将执行结果反馈给大脑中枢。数据驱动的价值体系落实到操作层面亦大抵如此:通过对数据的采集、整理、提炼,总结出规律形成一套智能模型,之后通过人机协同的方式作出决策,在人机协同的工作方式下直接驱动行动的快速执行,最终将决策和行动数据化并进行反馈。
完整的数据价值体系分为6个环节 ):数据采集、数据治理、数据建模、自动决策、指挥执行、反馈改进。
数据治理环节是数据标准化、数据资产化的过程,数据建模环节是通过建模,将数据转化为结构化的知识的过程;智能决策是自动化、智能化地开展数据洞察,推动业务和管理决策的过程;指挥执行是用决策的结果直接驱动业务活动的过程,包括下达任务指令、监控执行过程、分析执行结果、评价执行效果等一系列活动,确保数据驱动价值的实现;反馈改进是系统结合决策和执行中的反馈情况,通过深度学习算法去自动修正和完善的过程,最终形成一个动态的、自主发展的闭环。
1.数据采集是数据驱动闭环的起点
数据采集是数据驱动闭环的起点,是创造数据、重构系统、建立连接的过程。以往的数据采集方式主要有两种:一是伴随运营过程简单记录,最主要的特点是数据往往伴随着一定的运营活动而产生并记录在数据库中,比如超市每销售出一件产品就会在数据库中产生相应的一条销售记录。这种数据的产生方式是被动的、是伴随性的;二是用户原创,随着流媒体、移动互联网设备的快速发展,用户可以通过电商点评、平台意见发布等主动产生数据。
到了现在的感知式系统阶段,人们已经有能力制造极其微小的带有处理功能的传感器,通过对传统信息系统的重构,可以将这些感知设备广泛布置于企业内外环节的运转进行监控。这些设备会源源不断的产生新数据,这种数据的产生方式是自动的。数据产生经历了被动、主动和自动三个阶段,这些被动、主动和自动的数据共同构成了数据驱动的数据来源,而自动式的、由系统不间断的创造数据是数据驱动最主要的数据产生方式。
同时,互联网、移动互联网、物联网的突破性发展颠覆了人与人、人与物、物与物之间的连接方式,企业、供应商、用户、监管部门以及社会公开的数据通道得以打通,多维度、多种类的海量数据得以被实时、动态的采集,并在系统中汇总和融合,在这一过程中,系统又能通过数据对比、计算产生新一轮的高阶数据。
2.数据治理是数据标准化、资产化的过程
数据治理是数据标准化、数据资产化的过程。数据价值的体现,一定是建立在整条数据链路的效率和质量基础上的,没有有效的数据治理工作,就无法打造数据创造价值的基础和系统能力,在数据应用层发展到一定阶段时,必然会遇到制约和瓶颈,数据的维护成本急速上升,数据应用层每前进一步都会越来越难。
利用数据治理首先可以实现数据标准化,通过对数据的标准化定义,明确数据的责任主体,为数据安全、数据质量提供保障;其次,解决数据不一致、不完整、不准确问题,消除可能存在的对数据意义的理解偏差,减少各部门、各系统的沟通成本,提升企业业务处理的效率;最后,标准的数据及数据结构能为新建系统提供支撑,提升应用系统的开发实施效率。
同时,数据治理也是实现数据资产化的过程。数据资产是指由个人或企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源。根据国际数据管理协会(DAMA)给出的定义,数据治理是对数据资产管理行使权力和控制的活动集合。通过数据治理,可以完成对数据的集中清洗和标签定义,形成企业的主权数据,这些数据可以作为企业的战略资产,企业将进一步拥有和强化数据资源的存量、价值,以及对其分析、挖掘的能力,最终极大提升企业的核心竞争力。
3.数据建模将数据转化为结构化知识
建模环节是通过数据建模,将数据转化为结构化的知识的过程。通过建模环节,系统可以从海量非结构化数据中抽取结构化知识,并利用图分析进行关联关系挖掘,可以洞察“肉眼”无法发现的关系和逻辑,通过提取节点及关系信息,节点相互连接,形成知识网络结构,并逐渐积累为企业的结构化知识库。结构化知识库将双向作用于人和数字系统,通过提炼出简洁清晰可复用的知识模型,可以协助人实现快速回顾知识,节省下认知资源用于更高层次的思考,并形成小颗粒度的知识模块,便于系统自动进行知识重组和知识创新,为自动化、智能化的数据洞察打下基础。
4.智能决策是系统开展自动化数据洞察的过程
智能决策是系统自动化、智能化地开展数据洞察,推动业务和管理决策的过程。在应用初期,系统依靠AI技术进行数据洞察,帮助我们判断哪些是可以被委派给计算机的决策任务,哪些是短期内仍需要依靠人来决策的管理问题。对于可委派的决策,通过计算机程序自动分析、自动进行;对于尚需要人做出的决策,将管理层的决策行为作为知识不断输入系统,利用机器学习等方式促进系统形成智能算法,通过知识发现系统,产生新的规则、算法或模型。
随着智能机器人和数字孪生技术的不断发展,人机共生程度日益提高,数据驱动下的企业信息系统也在对历史、现实案例进行数字化基础上,通过机器学习进行样本归纳、类比推理分析,实现知识挖掘、计算和持续迭代更新,从而渐渐向高阶智能决策发展。智能决策体现适应性、动态性和演化性的智能体理性决策特征,智能系统能融合人的思维规律引导使用者解决问题,围绕作为决策客体的决策对象本身具有的动态变化特性,实现对决策问题的时空多维度解析,能够更加客观地审视问题全貌,并自动给岀方案并持续优化方案生成。
5.指挥执行是用决策结果驱动行为的过程
指挥执行是用决策的结果直接驱动行为的过程,通过监控执行过程、分析执行结果、评价执行效果,做出改进措施等一系列活动,确保数据驱动价值的实现。在系统完成自动化、智能化业务和管理决策后,这些决策将通过系统指令的方式实时指导企业各类业务经营环节的最佳行动。这种由数据直接驱动的行为是整体性的,能够将企业复杂的战略决策落实到多环节、跨职能的业务场景上。同时,系统将监测整个的决策执行过程,以便在用户交互和运营业务期间进行执行结构的动态分析和实时建议最佳操作。在此基础上,实现对不断变化的执行情况和用户动态的快速响应。
此外,随着人机共生程度不断提高,在数据驱动下,虚拟与现实进一步融合,可以预见在诸如元宇宙等环境下人和系统在行动上的同步趋势,即共同对决策的执行做出实时调整和完善,并将不断从对行为数据的分析和评价中吸取知识,使从决策、执行到改进整个过程的时间间隔大幅缩短,实现效率最大化。
6.反馈改进是系统自动修正和完善的过程
反馈改进是系统结合决策反馈、行动反馈的情况,通过深度学习算法去自动修正和完善的过程,通过反馈使数据驱动最终形成一个动态的、自主发展的闭环。在数据驱动下,系统是可以实现自我学习和完善的,但是这个过程需要反馈数据的不断输入,需要模型根据比对决策结果、执行结果的现实数据把偏差信息反馈给机器学习,形成正向和负向的数据反馈,才能在其后不断的机器学习迭代过程中自我完善。因此,数据驱动闭环要求要有流式的数据不断地注入,要有以机器学习为基础的决策模型,要有能依赖模型输出结果可以推动的业务系统,还要有可以反馈预测偏差的反馈机制。
以个性化推荐为例,通过采集许多用户行为数据,在这个基础上训练用户兴趣模型,然后给用户推荐信息,再将用户的使用数据反馈到模型中,基于行为数据构建深度学习召回算法策略,采用排序模型训练数据,使系统自主调整相应的兴趣模型,实现在特定的场景针对特定用户的个性化推荐。
数据驱动通过自动化手段实时采集、分析相关信息,形成智能模型,基于人机协同的工作方式主动赋能科学决策、开展相关行动并形成数据反馈。在数字化、智能化时代,构建数据价值体系,打造数据驱动型企业成为决定企业生存和发展的关键问题。