取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
数据驱动管理的灵魂之问:为什么、谁、是什么以及如何做
来源: 数据驱动智能  作者: 晓晓 2023-11-16 15:03:07
虽然许多组织渴望成为数据驱动型组织,但其中很大一部分往往只关注数据的技术方面,主要将其视为技术资产。因此,他们的投资和举措通常以技术驱动的努力为中心。然而,必须认识到技术是达到目的的手段。

虽然许多组织渴望成为数据驱动型组织,但其中很大一部分往往只关注数据的技术方面,主要将其视为技术资产。因此,他们的投资和举措通常以技术驱动的努力为中心。然而,必须认识到技术是达到目的的手段。

我认为,在进入详细的技术实施计划之前,解决4个基本问题至关重要:

1.为什么我们应该在组织内利用数据?换句话说,数据能为我们的组织带来什么好处?

2.谁是参与数据处理的主要利益相关者?该群体涵盖广泛,包括业务用户、执行管理层、客户以及数据工程师和数据科学家等技术角色。

3.可以采取什么系统方法将原始数据转化为有形价值? 此过程涉及从数据中获取价值 的分步蓝图。

4.我们如何才能有效地实现数据驱动的愿望?这包括技术和数据管理实践的集成,使数据视角与总体业务和组织目标保持一致。

在本文中,将更深入地探讨这些关键问题,并探讨明确定义的数据策略如何在确保这些问题的答案与公司的战略目标和项目保持一致方面发挥重要作用。

一、为什么采用数据驱动

我始终主张揭示数据驱动管理背后的潜在动机。是什么推动了数据工作的价值?解决“为什么”问题有助于衡量即将到来的数据项目的潜在回报。明确数据目标将为众多后续决策提供宝贵的指导。

制定用例场景并将其与潜在的价值驱动因素联系起来,可以提供回答问题所需的见解。用于说明价值驱动因素的常用模型是贝恩公司的B2B和B2C价值金字塔。从这个框架中,我在数据项目中经常利用的几个价值驱动因素包括:

1.透明度——利用仪表板提供公司指标的透明、客观的视图。例如,精心制作的营销报告可以使关键的营销活动指标对营销人员和营销活动利益相关者提高透明度。

2.降低成本——报告工具可以对流程绩效进行深入分析,有助于识别可实现成本降低 的领域。

3.集成——数据项目可以集成不同来源的数据,产生新的观点和见解。这种集成可以帮助检测异常并提供端到端的流程见解。

4.可用性——提示驱动的人工智能工具(或聊天机器人界面)几乎总是可以访问,让我们可以全天候请求信息。

5.节省时间——人工智能驱动的应用程序通常会自动执行大量重复性任务。例如,他 们可以自动将服务台票分配给适当的员工,或在简洁的仪表板中总结社交媒体情绪。

6.可持续性——数据驱动工具可以根据内部和外部数据源阐明ESG相关指标。这有助于组织推进其可持续发展目标。

我想使用具体的用例场景来回答“为什么”问题,具体描述想要使用数据的场景以及相应的价值是什么。这将有助于识别“谁”将在哪个过程中使用数据。

二、谁是数据驱动的利益相关方

回答“谁”的问题有助于评估您当前和设想的组织的文化背景。仅靠数据无法创造价值;您需要个人带领您的组织获得数据洞察并根据数据驱动的结果采取行动。了解潜在的数据用户对于在工具、基础设施和构建数据驱动文化方面做出明智的选择至关重要。

回答“谁”的问题有助于评估当前和未来的组织的数据基因。以下是一些数据文化特征的示例这些特征将影响后面“什么”和“如何“问题的答案:

1.软件自主开发——贵公司是否有构建和维护自己软件的传统?您打算继续投资开发 吗?在这种情况下,与内部数据工程团队合作可能是一个谨慎的选择。

2.IT外包文化——贵公司是否习惯外包IT解决方案?如果是这样,我建议考虑“购买” 方法,而不是开发内部解决方案。

3.主动性的因素——您的组织是否提倡自下而上的员工主动性?如果答案是肯定的, 那么培养一种自助数据文化,让员工可以产生自己的见解,将会是有益的。

4.专业领域知识——您的组织是否拥有在其他地方很难找到的独特领域知识?在这种 情况下,识别这些领域并投资专门的、定制的数据产品是值得的。

5.专业技术知识——组织中是否已经具备与数据相关主题(例如云、数据库或数据管道)相关的专业技术知识?组织在此类技术领域的成熟度对于如何选择正确的数据平台至关重要。

6.数据分析习惯——数据分析是否已经成为您组织决策的常识?那么,让这些用户更进一步并为他们提供更成熟的工具来进行更好、更深入的分析将是一个好策略。

三、采用什么方法将数据转化为价值

从广义上讲,“什么”问题可以通过遵循 DIKW金字塔中概述的基本步骤来解决,其中包括将原始数据提炼为智慧的过程,经历信息和知识的阶段。

价值主要是通过首先将原始数据转化为数据产品来实现的。最终用户可以通过数据工具访问这些产品。我更喜欢将这些通用阶段分解为三个略有不同的组成部分:

1.数据产品:对于“什么”阶段,必须确定促进“为什么”阶段中概述的用例所需的特定数据产品。这些数据产品可以被视为可重用的数据集,例如包含有关订单、发票或客户信息的数据集。

2.数据工具: 确定指定数据个人(如“谁”阶段中确定的)将使用哪些工具是“什么”阶段的一个关键方面。评估用例场景是否需要专门的统计工具,或者是否可以将数据驱动的算法无缝集成到现有的数字应用程序中。数据可用性的概念与数据工具的选择密切相关。

3.原始数据:查明构建已识别数据产品所需的原始数据也很重要。原始数据和数据产品的识别通常涉及迭代过程,原始数据的可用性激发新数据产品的创建,反之亦然。

现在我们已经全面了解了输入(原始数据)和输出(数据产品),就可以继续确定将原始数 据转换为这些产品所需的必要数据转换(技术上称为“管道”)。在此阶段,捕获与这些管道相关的功能需求变得特别重要。常见的功能要求是:

数据新鲜度:确定数据产品所需的新鲜度级别。需要实时信息,还是每小时更新就 足够了?

数据量和速度:评估需要转换和集成的数据量以及该数据量扩展的速度。

数据多样性:识别需要转换的各种原始数据源。考虑这些源是否主要由关系数据库系统(RDBMS)中的结构化数据组成,或者是否还包含文档、视频和图像等非结构化数据类型。

四、如何将数据转化为有价值的见解

现在您已经清楚地回答了“为什么”、“什么”和“谁”问题,下一步就是解决“如何做”。在此阶段,将确定最佳的技术架构,并根据这些新发现的数据驱动功能制定有效管理组织的策略。

(1)技术

目标是发现与目标相符并与组织的“为什么”、“什么”和“谁”方面相协调的技术工具。例如,如果缺乏在组织内内部化开发能力的策略,那么选择以自定义开发为中心的数据方法是不切实际的。

在建立数据平台时,必须仔细考虑一系列技术选择。虽然此列表并不详尽,但它强调了一些关键的权衡:

1.购买与构建:必须清楚地界定数据平台的哪些组件应该在内部构建,哪些组件更适合购买或租赁。针对已解决的问题重新发明解决方案通常不会产生什么价值,而在平台内创建独特的分析用例则可能非常有益。当然,服务和工具的成本和性能影响在这些决策中发挥着重要作用。

2.数据转换类型:考虑需要集成和转换数据的能力。如果目标用户是处理大量数据的数据工程师,那么使用Spark和Python或Scala等技术进行管道是一个很好的选择。对于不太复杂的场景,低代码解决方案或SQL可能更合适。所需的数据新鲜度也会影响此决策,因为某些管道技术非常适合实时场景,而其他技术则不然。

3.计算引擎:数据的数量和性质以及新鲜度要求决定了计算引擎的选择。对小型数据集使用广泛的大数据计算能力通常在成本和性能方面效率低下。此外,在将非结构化数据加载到关系数据库管理系统(RDBMS)之前对其进行转换通常被认为是一种反模式。在这种情况下,支持 Lakehouse模式的计算架构可能更合适。

4.云还是本地: 与购买与构建决策类似,评估数据平台的哪些部分适合云、哪些部分不适合至关重要。要考虑的因素包括您组织的云愿景和成熟度。此外,分析与云服务相关的未来运营支出与本地解决方案的传统资本支出。

5.集成:促进数据在组织内的正确时间无缝流动到正确的位置对于创造价值至关重要。 因此,定义数据集成模式是关键的一步。常见选项包括通过API进行数据访问、数据库连接或在流管道中创建数据主题。

技术决策通过数据平台的实现付诸实施,从数据中提取价值。该数据平台由多种技术产品组成:(云)服务、现成软件产品和定制技术解决方案。由此产生的软件堆栈应该满足实现回答“为什么”问题时概述的目标所需的标准。

(2)数据管理

建立强大的技术基础是启动组织数据计划的关键一步。有效的数据管理是确保全面数据实践持续成功的关键。在数据驱动型组织的框架内,几个关键的数据管理因素发挥着作用:

1.角色和职责: 数据管理的一个关键方面涉及创建一个清晰的模型,概述数据处理的 角色和职责。该框架回答了一个基本问题:谁对特定数据负责?一旦定义,该结构就会确定解决有关特定数据集的查询或解决数据质量问题的首选人员。然而,数据所有者并不是孤立运作的。例如,可以构建RACl模型来补充和履行角色和职责。 ·

2.数据质量:任何数据驱动产品或后续技术利用的有效性都取决于数据的基础质量。 基本的数据管理实践围绕着对数据质量的持续监控。鼓励数据所有者(如上一点所述)采取旨在提高数据质量的措施。

3.数据发现:无论数据管理是分布式的还是集中式的,每个数据管理团队都应该全面了解组织内可用的各种数据元素。采取措施以确保整个组织中的个人知道在哪里可 以找到特定的数据集。

4.支持数据流程: 广泛处理数据通常涉及劳动密集型流程。这些流程包括数据访问管 理(获得数据所有者的同意以访问特定数据集)、数据共享(与他人共享数据产品) 以及记录数据安全级别。结构良好的数据管理实践可以制定策略来简化和优化这些支持数据流程。

虽然数据管理的主要目标不是技术驱动的,但工具可以显着加快数据管理实践的成熟。这些工具涵盖范围广泛,从用于可视化数据模型的数据目录到用于监控数据质量状态的数据质量工具,以及旨在促进各种数据处理的特定工具。尽管不同的供应商可能对这些工具的定位不同,但它们的基本概念很大程度上植根于元数据管理。

五、制定数据策略

我建议采用敏捷数据策略,因为期望“为什么”、“谁”、“什么”和“如何”问题的答案在较长时间内保持不变,并且通常在数周或数月内发生变化是不现实的。虽然鼓励拥抱变革,但对所有动态要素保持全面的看法可能具有挑战性。这就是为什么我建议寻求一种方法,使“为什么”、谁”、“什么”和“如何”之间的联系变得切实可见。

计划板可以帮助将技术产品和数据管理计划(“如何”)与最终的数据产品(“什么”)以及最终的价值贡献(“为什么”)联系起来。我还喜欢通过在板上标记各种卡片来跟踪“谁”角色。 我更喜欢的策略是利用一个简單但功能极其强大的“数字规划板”,具有三个垂直通道:

1.如何: 该通道重点关注技术产品,例如管道、计算资源、数据库和数据管理计划, 以促进后续的“什么”和“为什么”。

2.内容:该通道涉及包含实现用例场景所需数据的数据产品。

3.原因:在此通道中,可以确定用例所贡献的价值驱动因素。 ·

此外,我建议在规划板最右侧的项目上标记相关的角色(“谁”)。这种做法可确保交付的价值符合组织的文化和数据基因。

通过从左到右绘制连接,可以快速掌握价值驱动因素和支持计划之间的关系。这种战略方法有助于获得对变革性“如何”项目的支持,这些项目最终将为“为什么”方面带来重大价值。

结论

通过解决四个核心问题“为什么”、“谁”、“什么”和“如何”我门可以了解技术实施和数据管理计划如何与组织更广泛的价值驱动因素保持一致。明确定义的数据策略在保持这种一致性并确保技术实施与组织数据基因之间的文化和谐得以维持方面发挥着至关重要的作用。

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:乔帅臣
关键词:   数据驱动  转换数据  计算引擎 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。