你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

将云规模分析集成到云采用策略中

使用 Azure 云采用框架中的策略方法为组织创建单个集中式云采用策略。 如果尚未记录云采用策略,请使用策略和计划模板来完成。

本文包含针对云规模分析方案(其会影响更广泛的策略)的注意事项。

在实现云规模分析之前,请制定数据策略计划。 可以从简单的单个用例开始,也可以从需要优先级的更大用例集开始。 制定策略有助于建立流程,以及开启初始对话(关于需要关注的要素)。

为你的数据战略优先考虑业务成果

成功的数据策略可带来竞争优势。 应始终保持数据策略与所需业务成果的一致性。 大多数业务成果都可以归为以下四个类别中的一个:

  • 为员工赋能:让员工可以实时了解客户、设备和机器。 了解上诉内容可帮助员工高效协作,从而快速满足客户或业务需求。

  • 与客户互动:提供受品牌启发的个性化、丰富、互联的体验。 利用强大的数据和见解,逐步推动客户在其旅程中提高忠诚度。

  • 优化运营:增强整个组织内的信息流。 同步业务流程,并使用数据驱动的方法使每次交互都变得有价值。

  • 转变产品和开发生命周期:收集有关你的服务和产品的遥测数据。 使用遥测数据确定发布的优先级或创建新功能,并持续评估有效性和采用率。

在确定业务成果的优先级后,检查当前的项目和长期战略计划,并相应地对其进行分类。 请考虑根据复杂性和影响,将以上四类业务成果以矩阵的形式结合起来。 此外,还可考虑添加体系结构要素,以帮助更深入地了解方案。

解锁战略价值

构建一种数据驱动的文化,以一种一致、具备前瞻性、灵活且消息灵通的方式推动业务发展,这个过程中存在着一些内在的复杂性和基础现实。 在进入部署阶段之前,请专注于形成一致的数据策略,以帮助实现所需的业务成果。

云规模分析与以创新为中心的动机保持一致。 以下是驱使客户将此方案集成到其云采用策略中的常见因素:

  • 可缩放的分析框架,支持构建企业数据平台
  • 自助服务,赋能用户探索数据、创建数据资产以及开发产品
  • 以数据为主导的文化(通过可重复使用的数据资产、数据社区、安全的第三方交换和就地共享来打造)
  • 使用策略、通用标识、机密性和加密,放心地共享数据
  • 改善客户体验并提高参与度
  • 产品或服务转型
  • 新产品或服务带来市场波动

下图包含关键主题,可帮助你在自己的策略中实现以上驱动因素。 请仔细分析这些主题以及它们对构建连贯的数据策略做出了怎样的贡献。 另请考虑这些主题如何解锁数据的策略价值,实现一致的业务增长。

示意图显示提高效率、数据民主化和治理的关键主题。

“数据策略是将数据用作资产和推动业务发展的基础。 不是针对数据问题的修补工作。 这是一个长期的指导性计划,定义了为解决数据挑战而要投入的人员、流程和技术。

创建策略只是其中一个步骤。 在企业范围内执行策略将对组织的现有文化、人员、流程和技术选择提出巨大挑战。 执行策略需要组织各级的承诺和明确的所有权划分。

提高效率

云的敏捷性要求组织快速适应并为所有业务领域带来效率。 根据 Gartner 关于新兴风险的报告,尽管组织继续关注和投资数字计划,但其中三分之二的组织显示出企业弱点,且未能达到预期,即使他们仍继续关注和投资数字计划。

可操作化数据管理

许多组织在逐渐分散中央 IT,以实现敏捷性。 组织希望快速创新,以自助服务方式访问企业范围内的统一数据可帮助组织实现具有挑战性的业务需求。

企业无法充分利用其数据的全部潜力的原因有很多。 可能是因为业务职能各自为政,每个团队使用不同的工具和标准进行数据分析。 或者,可能是因为无法将关键绩效指标链接到总体业务目标。

数据民主化有助于将这一价值带回业务,实现具有挑战性的业务增长目标。

  • 了解 LOB 需求并确定其优先级。
  • 跨域分配数据,从而支持所有权实现,使数据更接近用户。
  • 部署自助服务数据产品,推动见解获取和业务价值实现。

对于数据治理,请务必在分散式数据民主化体系中保持适当的平衡。 如果治理执行过于严格,则可能会扼杀创新。 然而,如果连一些至少的核心原则和流程都不具备,则很可能会最终导致数据孤岛。 这些孤岛可能损害组织的声誉和潜在收入。 若要以一致的方式解锁数据的策略价值,整体的数据治理方法至关重要。

如果缺乏深思熟虑的数据策略,则有必要“赶快行动”,尽快为组织提供价值。 通过应对前面提到的关键主题,或将这些主题用作框架中的策略原则,可解决当前业务问题。 使用这些关键主题还可以帮助创建一个整体数据策略,该策略通过验证进行迭代,但仍能提供及时的结果。 企业和技术领导人必须制定从数据中产生价值所需的策略并培养相应的思维方式,并以简化、结构化的方式快速扩展

有关详细信息,请参阅什么是数据治理?

培养数据驱动的文化

要制定成功的数据策略,你需要数据驱动的文化。 打造一种持续促进开放、协作参与的文化。 在这种文化下,全体员工都可以学习、交流并改进组织的业务成果。 打造数据驱动的文化还将提高每个员工在数据的支持下产生影响或影响力的能力。

你的旅程起点取决于你所在的组织、行业以及你在成熟度曲线上的当前位置。 下图显示了一个成熟度模型示例,其中概述了组织的 AI 使用情况的成熟度级别:

组织成熟度演变的示意图。

级别 0

未能以编程且一致方式利用数据。 组织的数据重点是从应用程序开发的角度出发。

在级别 0 上,组织通常有计划外的分析项目。 每个应用程序都根据独特的数据需求和利益干系人需求进行了专门的设计。 每个应用程序也都有重要的代码库和工程团队,其中许多是在 IT 之外设计的。 用例支持和分析是孤立的。

级别 1

在级别 1,团队正在形成,策略也正在创建,但分析仍然是部门化的。 组织往往擅长传统的数据捕获和分析。 其可能对云规模的方法有一定程度的承诺。 例如,组织可能已经从云中访问数据。

级别 2

组织的创新平台几乎已准备就绪。 已制定相关工作流来解决数据质量问题。 组织可以解答一些“为什么”的问题。

在级别 2,组织正在积极搜索端到端数据策略,该策略使用集中治理的数据湖存储来控制数据存储蔓延,并提高数据可发现性。 组织已为智能应用程序做好准备,这些应用程序将计算引入集中治理的数据湖。 这些智能应用程序可降低隐私风险、计算成本,并减少对重要数据的联合副本的需求。

在此级别,组织也已准备好使用多租户、集中托管的共享数据服务来执行常见数据计算任务。 这些共享数据服务将加快从数据科学驱动的情报服务中获取见解的速度。

Level 3

组织使用整体数据方法。 与数据相关的项目将与业务成果集成。 该组织使用分析平台进行预测。

在级别 3,组织将从数据资产和应用程序开发的角度解锁数字创新。 基础数据服务已就位,其中包括数据湖和共享数据服务。

组织内的多个团队将成功交付关键业务工作负载、关键业务用例和可衡量的成果。 使用遥测标识新的共享数据服务。 IT 是整个公司团队值得信赖的顾问,其使用受信任且相互连接的端到端数据策略来帮助改进关键业务流程。

级别 4

在级别 4,整个组织将使用框架、标准企业并拥有数据驱动的文化。 可以观察到自动化、数据驱动的反馈循环以及围绕分析或自动化的卓越中心的实际效果。

制定与业务一致的目标

成功的关键在于:根据业务愿景确定优先事项并保持“大处着眼,小处着手,快速行动”的理念。 选择正确的用例并不一定要经历一个漫长而艰难的审查过程。 在任何业务部门中,如果有足够的数据来验证其投资回报率、更多需求和易于被接受,这可能是一个持续存在的问题。 事情可能进展得很快,而这正是大多数公司难以起步的地方。

了解数据属性

要制定强大的数据策略,需要了解数据的工作原理。 了解数据的核心特征有助于构建处理数据的原则做法。

数据传播速度很快,但其速度不能违背物理定律。 数据必须遵守各项法律和创造数据的行业的法律。

数据不会自行更改,但其很容易发生更改和意外丢失,除非采取措施来缓解此类问题。 针对控件、数据库和存储采用防损措施,以应对无法预见的更改。 此外,请确保已设置好监视、审核、警报和下游进程。

数据本身不会生成任何见解或产生任何价值。 若要获取见解或提取价值,则必须让大部分或全部数据分别经历以下四个步骤:

  1. 引流
  2. 存储
  3. 正在处理
  4. Analytics

其中每个步骤都有其自己的原则、流程、工具和技术。

隐瞒数据资产和相关见解可能会影响社会经济、政治、研究和投资决策。 组织务必需要以安全且负责任的方式提供见解。 除非另有明确说明,否则生成或获取的所有数据都必须经过数据分类练习。 加密是处理静态和传输中机密数据的黄金准则。

数据、应用程序和服务都具有自己的引力,但数据的引力是最大的。 与艾萨克·牛顿的传奇苹果不同,数据没有任何可影响周围物体的物理质量。 而是具有延迟性和吞吐量,可帮助加速分析过程。 延迟、吞吐量和易于访问通常需要复制数据(即使并不需要这样做)。 适当地设置人员、流程、工具和技术,以便可平衡此类要求与组织的数据策略。

体系结构控制数据处理的速度。 结构通过软件、硬件和网络方面的创新得到了促进。 关于体系结构方面的一些注意事项包括:

  • 设置数据分发
  • 分区
  • 缓存技术
  • 批处理与流处理
  • 平衡后端与客户端处理

定义数据策略

将数据作为一种竞争优势来打造更好的产品和价值更高的服务并不是什么新鲜事。 新鲜的是云计算支持的数据量、速度和数据种类。

云中现代数据分析平台的设计包括安全性、治理、监视、按需缩放、数据操作和自助服务。 要区分一个数据策略是优秀还是良好,需要了解上述这些方面之间的相互作用。 使用云采用框架等工具可帮助确保体系结构的聚合性、完整性和最佳做法。

若要保持高效,数据策略必须包含数据治理预配。 下图展示了一个数据生命周期的主要阶段,以数据治理为重点:

数据生命周期示意图。

以下部分介绍在决定设计原则数据策略层时应使用的注意事项。 侧重于从数据交付业务成果和价值。

数据引入

数据引入的一个关键考虑因素在于:能够以安全且合规的方式快速构建从需求到生产的数据管道。 重要元素包括可补充数据湖的元数据驱动、自助服务和低代码技术。

生成管道时,请考虑设计和处理数据、分发数据和缩放计算的能力。 还必须确保为管道的持续集成和交付提供正确的 DevOps 支持。

Azure 数据工厂等工具支持大量本地数据源、服务型软件 (SaaS) 数据源以及来自其他公共云的数据源。

存储

在物理层和逻辑层中标记和组织数据。 数据湖是所有现代数据分析架构的一部分。 组织必须应用适当的数据隐私、安全性和合规性要求,以满足你所依据的所有数据分类和行业合规性要求。 编录和自助服务可帮助实现组织级别的数据民主化,在适当的访问控制指导下推动创新。

针对工作负载选择合适的存储。 即使第一次没有获得恰好适合的存储,也可通过云快速进行故障转移,重新开始你的旅程。 按照应用程序要求选择最佳数据库。 选择分析平台时,请务必考虑自己处理批量数据和流式数据的能力。

数据处理

数据处理需求因工作负载不同而异。 大多数大规模数据处理都包含实时处理和批处理元素。 大多数企业还需要考虑时序处理要求,以及需要针对企业搜索处理自由格式文本。

联机事务处理 (OLTP) 提出了最流行的组织处理需求。 某些工作负载需要专门的处理,例如高性能计算 (HPC),有时也称为“大计算”。这些工作负载使用许多基于 CPU 或 GPU 的计算机来解决复杂的数学任务。

对于某些专用工作负载,客户可以保护 Azure 机密计算等执行环境,这有助于用户在公共云平台中使用数据时保护数据。 这种状态是高效处理所必需的。 数据在受信任执行环境 (TEE) 中进行保护,这种环境也称为 Enclave。 TEE 可保护代码和数据免受任何外部查看和修改。 借助 TEE,可以在不牺牲数据机密性的情况下训练 AI 模型,即使使用来自不同组织的数据源也是如此。

分析处理

提取、转换、加载 (ETL) 结构与在线分析处理 (OLAP) 和数据仓库需求相关。 与业务一致的数据模型和语义模型使组织能够实现业务规则和关键绩效指标 (KPI),这些模型通常在分析过程中进行实现。 一个有用的功能是可以自动检测架构偏差。

数据策略摘要

针对其他注意事项(如数据治理和负责任 AI)采取原则方法,将在未来获益。

在 Microsoft,我们遵循四项核心原则:公平、可靠和安全、隐私和安全以及包容性。 透明度和问责制这两项基本原则是所有四项核心原则的基础。

通过开发资源和治理系统,我们将这些原则和负责任 AI 付诸实践。 我们的一些指导方针涉及人/AI 交互、对话式 AI、包容性设计、AI 公平性清单和数据集数据表。

我们还开发了一套工具来帮助他人在创新的每个阶段理解、保护和控制 AI。 这些工具是跨学科协作的成果,旨在加强和加速负责任的 AI。 合作涉及软件工程和开发、社会科学、用户研究、法律和政策。

为了加强合作,我们开源了许多工具,例如 InterpretML 和 Fairlearn。 其他人可以为这些开源工具做出贡献并基于这些工具进行构建。 我们还通过 Azure 机器学习使工具民主化。

成为数据驱动型组织的关键是在新常态下提供竞争优势的基础。 我们希望帮助我们的客户从仅应用程序的方法转变为以应用程序和数据为主导的方法。 专注于应用程序和数据的方法可以帮助创建端到端数据策略,以确保影响业务成果的当前和未来用例的可重复性和可伸缩性。

解锁数字创新的示意图。

促进承诺、沟通和参与

所有参与促使数据策略取得成功的关键角色,都必须清楚了解所采用的方法和常见业务目标。 关键角色可能包括领导团队(首席高管级)、业务部门、IT、运营和交付团队。

沟通是该框架中最重要的部分之一。 组织必须设计一个跨角色进行有效沟通的流程。 沟通有助于在当前项目的背景下有效地交付。 它还建立了一个论坛,帮助所有相关人员保持一致、了解最新情况,并专注于构建未来整体数据策略的总体目标。

以下两个群体之间的参与是必不可少的:

  • 设计和实施数据策略的团队成员
  • 参与、使用和利用数据的团队成员(例如将根据数据做出决策和生成结果的业务部门)

换句话说,如果构建数据策略和相关数据平台时没有用户的参与,则很可能会在相关性和采用方面遇到挑战。

有两个策略流程将有助于在此框架下成功交付:

  • 卓云中心的构成
  • 采用敏捷交付方法

有关详细信息,请参阅制定云规模分析计划

交付交付

当你以标准化和结构化的方式根据成功标准交付数据产品时,该交付将验证迭代框架。 此外,运用所学知识不断创新将有助于建立业务信心并扩大数据策略目标。 此过程可帮助整个组织实现更清晰、更快速的采用。

这同样适用于数据平台。 如果你有一种多个团队相对自主运作的机制,则可以朝着融合方向迈进。 实现该目的将是一个不断迭代的过程。 在许多情况下,需要对组织机制、就绪情况和业务一致性进行重大更改

后续步骤

阅读以下文章,查找云采用之旅相关指南,成功实现云采用方案: