Microsoft Fabric 采用路线图:数据文化

注意

本文是 Microsoft Fabric 采用路线图系列文章的一部分。 有关该系列文章的概述,请参阅 Microsoft Fabric 采用路线图

数据文化的构建与分析的采用密切相关,通常是组织数字化转型的一个关键方面。 不同组织可通过不同方式定义数据文化这一术语。 在本系列文章中,数据文化表示组织中的一组行为和规范。 它鼓励建立一种定期采用知情数据决策的文化:

  • 决策的主体啊组织中更多领域的更多利益干系人。
  • 基于分析,而非观点。
  • 采用基于卓越中心 (COE) 批准的最佳做法的有效、高效的方式。
  • 基于受信任的数据。
  • 这减少了对不成系统的落后知识的依赖。
  • 这减少了对预感和直觉决策的依赖。

重要

将数据文化视为一种行为,而不是一个口号。 数据文化不是一组规则(那是治理)。 因此,数据文化是一个有点抽象的概念。 它可以是允许、奖励和鼓励的行为和常规,或者不允许、不鼓励的行为常规。 请记住,健康的数据文化能够激励组织所有级别的员工来制造和传播可操作的知识。

在组织中,某些业务部门或团队可能有其自己的行为和常规工作方式。 实现数据文化目标的具体方式可能因组织边界而异。 重要的是,它们都应与组织数据文化目标保持一致。 可以将此结构视为一致的自治。

以下环形图展示了影响数据文化的相互关联的各个方面:

Diagram shows various relationships and influences in a data culture, which are described below.

该图描绘了以下各项之间的一些模糊关系:

本系列文章将讨论图中的元素。

数据文化愿景

数据文化的概念可能很难定义和度量。 尽管以一种有意义、可操作和可度量的方式表述数据文化是一件很有挑战性的事情,但对于健康的数据文化对组织的意义,需要有一个得到充分理解的定义。 健康数据文化的这种愿景应当满足以下条件:

  • 源自执行层。
  • 与组织目标保持一致
  • 直接影响采用策略。
  • 用作制定治理策略和指南的大概指导原则。

建立数据文化并不一定要得出什么具体的结果。 相反,数据文化的状态是强制执行治理规则(或缺乏治理规则)的结果。 各级领导者都需要通过行动积极展示对他们来说重要的内容,包括如何赞扬、认可和奖励积极主动的员工。

提示

如果你能够理所当然地认为自己开发数据解决方案(例如语义模型 [以前称为数据集]、湖屋或报表)的工作将受到重视和赞赏,这就很好地表现出你的公司拥有健康的数据文化。 但有时,它取决于你的直接上司最看重什么。

建立数据文化的最初动机常来自于特定的战略业务问题或计划。 可能是:

  • 一种反应性的更改,例如对新的敏捷竞争的响应。
  • 主动变更,如开始新的业务线,或扩大到新市场以抓住尚未被开发的机会。 与成熟的组织相比,限制更少、复杂度更低的组织从一开始就实现数据驱动可能相对更容易。
  • 由外部更改驱动,如要在经济低迷期消除低效和冗余的压力。

无论是以上哪种情况,往往都有数据文化扎根的特定领域。 该特定领域可能是比整个组织小的工作范围,即使它仍然很大。 在这个较小的范围内进行了必要的更改后,它们可以被增量复制并变通地应用到组织的其他部分。

尽管技术可以帮助推进数据文化的目标,但实现特定的工具或功能并不是目标。 本系列文章涵盖了有助于采用健康数据文化的许多主题。 本文的其余部分介绍了数据文化的三个重要方面:数据发现数据普及数据素养

数据发现

成功的数据文化依赖于用户在其日常活动中使用适当的数据。 要实现此目标,用户需要查找和访问数据源、报表及其他项。

数据发现是在整个组织内有效找到相关数据资产的能力。 数据发现主要关注的是提高对数据存在的认知,当数据在部门系统中孤立存在时,这尤其具有挑战性。

数据发现与搜索的概念略有不同,原因是:

  • 借助数据发现,即使用户当前无权访问项,也可查看该项的元数据,例如语义模型的名称。 用户知道数据存在后,可以通过标准流程请求访问该项。
  • 通过搜索,用户可在已能够安全访问现有项时找到该项。

提示

使用简单明了的流程,以便用户可以请求访问数据,这一点很重要。 知道数据存在,却无法通过域所有者建立的规范和流程来访问它,这可能会使用户感到沮丧。 这可能使得他们使用低效的应变方法,而不是通过适当的渠道来请求访问。

数据发现可通过以下方式帮助推动采用工作和治理做法的实现:

  • 鼓励使用受信任的高质量数据源。
  • 鼓励用户利用对当下数据资产的现有投资。
  • 提升对现有数据项(例如湖屋、数据仓库、数据管道、数据流或语义模型)或报表项(例如报表、仪表板或指标)的使用和扩充。
  • 帮助用户了解谁是数据资产的所有者和管理者。
  • 在使用者、创建者和所有者之间建立连接。

OneLake 数据中心使用认可是促进组织中数据发现的关键方式。

此外,数据目录解决方案是极其有价值的数据发现工具。 它们可以记录元数据标记和说明,以提供更深入的上下文和含义。 例如,Microsoft Purview 可以从 Fabric 租户(和许多其他源)扫描和编录项。

有关数据发现的问题

使用如下所示的问题来评估数据发现。

  • 是否有业务用户可在其中搜索数据的数据中心?
  • 是否有描述定义和数据位置的元数据目录?
  • 是否有高质量数据源通过认证提升得到了认可?
  • 由于用户找不到他们需要的数据,在多大程度上存在冗余数据源? 需要哪些角色才能创建数据项? 需要哪些角色才能创建报表或执行即席分析?
  • 最终用户是否可以查找和使用现有报表,或者他们是否坚持导出数据来创建自己的报表?
  • 最终用户是否知道使用哪些报表来解决特定业务问题或查找特定数据?
  • 用户是使用适当的数据源和工具,还是偏向于使用旧版数据源和工具?
  • 分析师是否了解如何使用新数据扩充现有认证的语义模型,例如使用 Power BI 复合模型
  • 数据项在质量、完整性和命名约定方面的一致性如何?
  • 数据项所有者是否可遵循数据世系来对数据项执行影响分析?

数据发现的成熟度级别

以下成熟度级别有助于评估数据发现的当前状态。

Level Fabric 数据发现的状态
100:起步 • 数据是碎片化且无组织的,没有清晰的结构或流程来查找数据。

• 用户难以查找和使用其任务所需的数据。
200:可重复 • 正在做出分散或有组织的努力来组织和记录数据,但仅限在某些团队或部门中。

• 内容偶尔获得认可,但这些认可未定义,而且过程不受管理。 数据仍然是孤立、碎片化的,因此很难访问。
300:已定义 • 中央存储库(例如 OneLake 数据中心)用于使需要数据的用户能够更轻松地找到数据。

• 有明确的流程来认可高质量数据和内容。

• 基本文档包括目录数据、定义和计算,还显示查找这些内容的位置。
400:有能力 • 有结构化、一致的流程指导用户如何认可、记录数据,以及如何从集中式中心查找数据。 数据孤岛属于例外,而不是规则。

• 高质量数据资产得到一致认可且易于识别。

• 维护综合数据字典并改进数据发现。
500:高效 • 系统性地整理数据和元数据,并以数据世系的完整视图记录这些内容。

• 高质量得到认可且易于识别。

• 使用目录工具(例如 Microsoft Purview)让数据可被发现来供使用和治理。

数据普及

数据普及是指将数据交给更多负责解决业务问题的用户。 这是为了让更多用户能够做出更好的数据驱动型决策。

注意

数据普及的概念并非暗示其缺乏安全性,也未暗示缺少基于职务的正当性。 作为健康数据文化的一部分,数据普及通过提供以下语义模型,帮助减少影子 IT:

  • 安全的、受治理的且妥善管理的数据集。
  • 以高成本效益的方式及时满足业务需求。

组织在数据普及上的立场将对采用与治理相关工作产生广泛影响。

警告

如果数据访问权限或执行分析的能力仅限于组织中一定数量的个人,这通常需要引起警觉,因为使用数据的能力是健康数据文化的关键特征。

有关数据普及的问题

使用如下所示的问题来评估数据普及。

  • 数据和分析是易于访问,还是仅限于受限的角色和个人访问?
  • 对于请求访问新数据和工具的人员,是否部署了有效的过程?
  • 数据是可在团队和业务部门之间随时共享,还是孤立且受到密切保护?
  • 谁有权限安装 Power BI Desktop?
  • 谁有权拥有 Power BI Pro or Power BI Premium Per User (PPU) 许可证?
  • 谁可以在 Fabric 工作区中创建资产?
  • 自助式分析和商业智能 (BI) 用户赋能的理想水平是什么? 此水平如何根据业务部门或职务而变化?
  • 企业与自助式分析和 BI 之间的理想平衡是什么样的?
  • 哪些主题和业务领域强烈首选哪些数据源? 允许使用未经批准的数据源做什么?
  • 谁可以管理内容? 对于数据与报表来说,此决策是否不同? 对于企业 BI 用户和分散用户,此决策是否不同? 谁可以拥有和管理自助式 BI 内容?
  • 谁可以使用内容? 对于外部合作伙伴、客户或供应商,此决策是否不同?

数据普及的成熟度级别

以下成熟度级别有助于评估数据普及的当前状态。

Level 数据普及的状态
100:起步 • 数据和分析仅限于少数角色,这些角色可限制对其他内容的访问。

• 业务用户必须请求访问数据或工具才能完成任务。 他们经常遇到延迟或瓶颈。

• 在组织的各个领域都有自助式计划正在进行,并取得了一些成功。 这些活动的进行都比较混乱,很少有正式流程,且没有战略计划。 这些自助式活动缺乏监督和可见性。 每种解决方案的成败情况没有得到很好的理解。

• 企业数据团队无法跟上业务需求。 对于该团队来说,积压了大量的请求。
200:可重复 • 目前在扩展数据和工具访问权限方面的努力有限。

• 多个团队已在自助式解决方案上取得了可衡量的成功。 组织中的人员开始关注。

• 通过投资确定企业与自助式解决方案之间的理想平衡。
300:已定义 • 很多人有权访问他们需要的数据和工具,尽管并非所有用户都对他们创建的内容拥有平等的权限或平等负责。

• 有效的自助式数据做法在组织的更多区域以增量方式(且有目的地)复制。
400:有效力 • 企业和自助式解决方案创建者之间存在健康的合作关系。 明确、现实的用户责任和策略缓解了自助式分析和 BI 的风险。

• 部署了清晰、一致的流程,供用户请求访问数据和工具的权限。

• 积极构建有价值的解决方案的个人得到认可和奖励。
500:高效 • 用户问责和有效治理让中心团队对用户如何处理数据充满信心。

• 受监视的自动化流程让用户能够轻松访问数据和工具。 需要或有兴趣使用数据的任何人都可按照这些流程来执行分析。

数据素养

数据素养是指准确、有效地解释、创建和沟通数据和分析情况的能力。

培训工作(如启导和用户赋能中所述)常专注于如何使用技术本身。 技术技能对于产生高质量的解决方案来说很重要,但是考虑如何在整个组织中有目的地提高数据素养也同样重要。 换句话说,成功的采用不仅仅只是为用户提供软件和许可证。

如何提高组织中的数据素养取决于多种因素,如当前用户技能集、数据的复杂性以及所需的分析类型。 你可能选择专注于下列与数据素养相关的活动:

  • 解释图表和图形
  • 评估数据的有效性
  • 执行根本原因分析
  • 从因果关系中辨别相关性
  • 理解上下文和离群值对所呈现结果的影响
  • 通过故事讲述的形式帮助使用者快速理解和行动

提示

如果你在让数据文化或治理工作获得认可时很吃力,专注于通过数据发现(“查找数据”)、数据普及(“使用数据”)或数据素养(“理解数据”)实现的切实利益可以起到帮助。 关注可以通过数据文化进步来解决或缓解的特定问题也很有帮助。

让正确的利益干系人就问题达成一致通常是第一步。 然后,就是让利益干系人就解决方案战略方法,以及解决方案细节达成一致。

有关数据素养的问题

使用如下所示的问题来评估数据素养。

  • 组织中是否有通用的分析词汇用于讨论数据和 BI 解决方案? 或者,不同孤岛之间的定义是否是碎片化且不同的?
  • 与直觉和主观经验相比,用户根据数据和证据做决策时感觉有多舒服?
  • 当持有某种观点的用户面对相矛盾的证据时,他们如何反应? 他们是批判性地评估数据,还是忽视数据? 他们是能改变自己的观点,还是变得顽固和抗拒?
  • 是否有培训计划来支持用户学习数据和分析工具?
  • 是否存在对可视化分析和交互式报告的明显抵触,而支持静态电子表格?
  • 人们是否愿意接受新的分析方法和工具来更有效地解决其业务问题? 或者,他们是否希望继续使用现有方法和工具来节省时间和精力?
  • 组织中是否有方法或计划来评估或提高数据素养? 领导层是否对数据素养水平有准确的理解?
  • 是否有数据素养特别强或特别弱的角色、团队或部门?

数据素养的成熟度级别

以下成熟度级别有助于评估数据素养的当前状态。

级别 数据素养状态
100:起步 • 决策通常是根据直觉和主观经验做出的。 当遇到对现有观点提出挑战的数据时,数据往往会被忽视。

• 个人在决策过程或讨论中使用和理解数据的信心不高。

• 报表使用者对静态表有强烈的偏好。 这些使用者将交互式可视化效果或成熟的分析方法视为“花里胡哨”或不必要。
200:可重复 • 某些团队和个人在将数据纳入到决策制定方面的行为不一致。 很明显在某些情况下,对数据的误解导致了决策有缺陷或结论错误。

• 当数据与预先存在的观点相矛盾时,存在一些阻力。

• 有些人对交互式可视化效果和成熟的分析方法持怀疑态度,尽管它们的使用正在增加。
300:已定义 • 大多数团队和个人都理解与他们的业务领域相关的数据,并暗中使用此数据来做出明智的决策。

• 当数据与预先存在的观点相矛盾时,会引发批判性的讨论,有时还会激发转变。

• 可视化效果和高级分析被更广泛地接受,但有时并未被有效地使用。
400:有能力 • 数据素养被明确认为是组织中的一项必备技能。 有一些培训计划来培养数据素养。 做出了具体努力来帮助在数据素养方面特别弱的部门、团队或个人。

• 大多数个人能有效地使用和应用数据,客观地做出更好的决策并采取行动。

• 记录了可视化和分析最佳做法,并在战略重要的数据解决方案中遵循这些做法。
500:高效 • 数据素养、批判性思维和持续学习是组织中的战略技能和价值观。 有效的程序监视着进度,以提高组织中的数据素养。

• 决策制定由整个组织中的数据驱动。 使用了决策智能或规范性分析来推荐关键决策和操作。

• 可视化和分析最佳做法被视为使用数据生成业务价值所必不可少的。

注意事项和关键措施

清单 - 下面是一些可以用来增强数据文化的注意事项和关键措施。

  • 在数据文化目标和策略上保持一致:仔细考虑要培养的数据文化类型。 理想情况下,它更多是来自于用户赋能的位置,而不是命令和控制的位置。
  • 了解当前状态:与不同业务单位中的利益干系人沟通,了解哪些分析做法目前运作良好,哪些做法不适用于数据驱动的决策。 开展一系列研讨会,了解当前状态并规划期望的未来状态。
  • 与利益干系人沟通:与 IT、BI 和 COE 中的利益干系人沟通,了解需要考虑的治理约束。 这些谈话可为团队提供一个培训机会,让团队了解诸如安全和基础结构等主题。 还可以借此机会向利益干系人介绍 Fabric 中包含的特性和功能。
  • 验证执行倡导:验证你为推进数据文化目标准备的执行倡导和支持级别。
  • 制定有关数据策略的目的性决策:对于组织中的关键业务部门来说,决定业务导向型自助式、托管自助式和企业数据、分析和 BI 用例的理想平衡应该是怎样的(在内容所有权和管理一文中有所介绍)。 另请考虑该数据策略与个人、团队、部门和企业分析和 BI 的已发布内容之间的关系(在内容分发范围一文中有所介绍)。 针对此战略计划确定你的大致目标和优先级。 确定这些决策将对你的战略计划造成什么影响。
  • 制定战略计划:开始为即时、短期和长期行动项目制定战略计划。 标识表示“快赢”并可以产生明显差异的业务组和问题。
  • 创建目标和指标:确定如何衡量数据文化计划的有效性。 创建关键绩效指标 (KPI) 或目标和关键结果 (OKR),以验证工作结果。

有关数据文化的问题

使用如下所示的问题来评估数据文化。

  • 数据是否被视为组织的战略资产?
  • 是否存在源自高管领导并与组织目标保持一致的健康数据文化愿景?
  • 数据文化是否指导创建治理策略和指南?
  • 内容创建者和使用者是否信任组织数据源?
  • 在证明观点、决策或所做选择时,用户是否使用数据作为证据?
  • 有关分析和数据使用的知识是否有记录,或者是否依赖未记录的部落知识?
  • 为开发数据解决方案所做的努力是否受到用户社区的重视和赞赏?

数据文化的成熟度级别

以下成熟度级别有助于评估数据文化的当前状态。

级别 数据文化状态
100:初始 • 企业数据团队无法跟上业务需求。 存在大量积压请求。

• 在组织的各个领域都有自助式数据和 BI 计划正在进行,并取得了一些成功。 这些活动的进行都比较混乱,很少有正式流程,且没有战略计划。

• 自助式 BI 活动缺乏监督和可见性。 并未充分理解数据和BI 解决方案的成功或失败。
200:可重复的 • 多个团队已在自助式解决方案上获得了可度量的成功。 组织中的人员开始关注。

• 通过投资确定企业与自助式数据、分析和 BI 之间的理想平衡。
300:已定义 • 为推进数据文化建立了具体目标。 这些目标以增量方式实现。

• 分享从各个业务部门中的实际效果学到的经验。

• 有效的自助式做法在组织的更多区域以增量方式(且有目的地)复制。
400:有效力 • 采用明智决策的数据文化目标与组织目标保持一致。 它们受到执行倡导人、COE 的积极支持,并直接影响采用策略的落实。

• 执行发起人、COE、业务部门和 IT 之间存在健康、高效的合作关系。 团队正在努力实现共同的目标。

• 积极构建有价值的数据解决方案的个人得到认可和奖励。
500:高效 • 定期评估和度量数据、分析和 BI 解决方案的业务价值。 KPI 或 OKR 用于跟踪数据文化目标以及这些工作的结果。

•反馈循环已到位,它们鼓励持续的数据文化改进。

• 持续提高组织采用、用户采用和解决方案采用是首要任务。

在 Microsoft Fabric 采用路线图系列的下一篇文章中,了解执行发起人的重要性。