你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
云管理中的业务承诺
业务承诺可帮助你以可接受的运营成本定义运营管理级别。 若要定义业务承诺,必须平衡优先级。 本文介绍如何评估数据点和计算以找到平衡点。
可以做出与业务稳定性相关的承诺,以证明业务决策的合理性。 稳定性承诺可以包括服务级别协议 (SLA) 或某种级别的技术复原能力。 对于大多数工作负载,你只需要一个基线级别的云管理。 对于其他工作负载,你在云管理上的花费可能是基线水平的两到四倍。 由于业务中断的潜在影响,你可以证明此成本是合理的。
本系列前面的文章可帮助你了解中断分类及其对各种工作负载的影响。 本文将帮助你计算回报。
下图显示,每个级别的云管理都有拐点,在这些拐点上,成本的增长速度可能快于复原能力。 这些拐点促使人们做出详细的业务决策和业务承诺。
确定适当的承诺
对于项目组合中的每个工作负载,云运营团队和云策略团队应在云运营团队直接提供的管理级别上保持一致。
当企业建立承诺时,确定如何协调以下方面。
- IT 操作的先决条件
- 管理责任
- 云租户
- 软成本因素
- 避免投资回报率 (ROI) 损失
- 管理层的验证
为了帮助你做出决策,以下部分更详细地介绍了这些方面。
确定 IT 运营先决条件
Azure 管理指南概述了 Azure 管理工具。 在企业做出承诺之前,IT 部门应确定一个可接受的标准级别管理基准,以应用于所有托管工作负载。 然后,对于 IT 产品组合中的每个托管工作负载,IT 可以根据 CPU 内核、磁盘空间和其他与资产相关的变量计算标准管理成本。 IT 还可以根据体系结构估算每个工作负载的复合服务级别目标 (SLO)。
IT 运营团队通常对初始复合 SLO 使用默认的最低 99.9% 的正常运行时间。 他们可能会根据平均工作负载规范化管理成本,特别是对于日志记录和存储需求最少的解决方案。 为了为初始对话提供一个起点,IT 运营团队可以对一些中等关键性工作负载的成本进行平均。
提示
如果你使用运营管理工作簿来规划云管理,则应更新运营管理字段,以反映 IT 运营先决条件。 运营管理字段包括承诺级别、复合 SLO 和每月成本。 每月成本应表示你每月添加的运营管理工具的成本。
运营管理基线是一个初始起点,你还应该从以下方面验证基线。
选择责任模型
在传统的本地环境中,你可能会认为管理环境的成本是 IT 运营的沉没成本。 沉没成本是无法收回的费用。 在云中,管理是一个有目的的决策,对预算有直接影响。 可以将每个管理功能的成本直接归因于部署到云的每个工作负载。 通过这种方法,你可以更好地控制。 但云运营团队和云策略团队必须首先就责任达成一致。
企业也可能将一些日常管理职能外包给服务提供商。 服务提供商可以使用 Azure Lighthouse 为企业提供精确的控制。 例如,可以授予对资源的访问权限,并更深入地了解服务提供商执行的操作。
为了管理云环境,可以实施各种模型。
委派责任模型:IT 运营可以使用一种称为委派责任的方法。 这种方法不需要集中管理,可以防止运营管理开销。 在云卓越中心 (CCoE) 模型中,平台运营和平台自动化提供了自助服务管理工具,业务主导的运营团队可以独立于集中式 IT 运营团队使用。
此方法可让业务利益干系人完全掌控与管理相关的预算。 CCoE 团队还可以确保正确实施最低限度的防护措施。 IT 充当代理和指南,帮助你的企业做出明智的决策。 业务运营监督依赖工作负载的日常运营。
集中式责任模型:如果你有合规性要求、技术复杂性或某些共享服务模型,你的企业可能需要集中式 IT 团队模型。 在集中式 IT 模型中,IT 履行其运营管理职责。
你可以集中管理和控制环境设计、管理控制和治理工具,这可以防止业务利益干系人做出管理承诺。 但是,对云方法的成本和体系结构的可见性使得集中式 IT 更容易就每个工作负载的成本和管理级别进行沟通。
混合模型:分类是管理职责混合模型的基础。 如果你的企业正在从本地向云转型,你可能需要一段时间的本地优先运营模型。 如果你的企业有严格的合规性要求或依赖于与 IT 外包供应商的长期合同,则可能需要集中式运营模型。
混合模型方法提供平衡。 在这种方法中,中心 IT 团队为所有任务关键型或包含敏感信息的工作负载提供集中式运营模型。 该团队将所有其他工作负载分类放在支持委派职责的云环境中。 集中式职责方法是一般的运营模型,但你的企业可以根据所需的支持和敏感度灵活采用专用运营模型。
考虑谁负责工作负载的日常运营管理。 你的职责方法会影响你的承诺。
管理云租赁
通常,当资产位于单个租户中时,你可以更容易地管理它们。 但可能需要维护多个租户。 有关为什么可能需要多租户 Azure 环境的详细信息,请参阅使用 Azure Lighthouse 集中管理操作。
考虑软性成本因素
下一节概述了一种确定与不同级别的管理流程和工具相关的比较回报的方法。 对于每个分析的工作负载,你可以衡量相对于业务中断的预测影响的管理成本。 使用以下方法来确定是否需要投资于更广泛的管理方法。
在计算数字之前,请考虑软性成本因素。 软性成本因素会产生回报,但这种回报很难通过损益表中可见的直接硬性成本节省来衡量。 软性成本因素可能表明,需要投资于比财政审慎更高水平的管理。
软性成本因素的一些示例包括:
董事会或 CEO 的日常工作负载使用情况。
前 x% 的客户的工作负载使用情况对其他地方的收入影响更大。
对员工满意度的影响。
要做出承诺,你应该评估的下一个数据点是软性成本因素列表。 在这个阶段,你不需要记录这些因素,但要让业务利益干系人了解它们的重要性,并将其排除在以下计算之外。
计算损失规避的 ROI
当负责云运营的 IT 团队计算运营管理成本的相对回报时,他们应完成前面提到的先决条件,并对所有工作负载进行最低级别的管理。
你的企业应该做出的下一个承诺是接受与基线管理产品相关的成本。 确定你的企业是否同意投资于基线产品/服务,以满足云运营的最低标准。
如果你的企业不同意这种管理水平,你必须制定一个解决方案,以便你的企业能够继续发展。 确保你的解决方案不会对其他工作负载的云操作产生重大影响。
你可能需要的不仅仅是标准管理级别。 以下部分有助于以避免损失的形式验证投资和相关回报。
提高管理级别
对于托管解决方案,除了管理基线之外,你还可以应用多个设计原则和模板解决方案。 可靠性和复原能力的每项设计原则都会增加工作负载的运营成本。 IT 和业务必须就这些额外承诺达成一致;因此,你必须了解在实施更多原则时可以避免的潜在损失。
以下计算提供了一些公式,可帮助你更好地了解损失和增加的管理投资之间的差异。 有关如何计算增加的管理成本的更多信息,请参阅工作负载自动化和平台自动化。
提示
如果你使用运营管理工作簿来规划云管理,请更新运营管理字段,以反映每个对话。 这些更改会更新 ROI 公式和以下每个字段。
估计停机时间
复合 SLO 是基于工作负载中每个资产部署的 SLA。 复合 SLO 字段驱动估计停机时间,在工作簿中标记为 Est. Outage
。 要在不使用工作簿的情况下计算每年的估计停机时间(以小时为单位),请应用以下公式:
估计停机时间 = (1 - 复合 SLO 百分比) × 一年中的小时数
工作簿使用默认值 8,760 小时/年。
标准损失影响
标准损失影响预测任何停机时间的财务影响,假设估计停机时间预测被证明是准确的。 标准损失影响在工作簿中标记为 Standard Impact
。 若要在不使用该工作簿的情况下计算此预测值,请应用以下公式:
标准影响 = 预计中断时间 @ 99.9% 的运行时间 × 时间值影响
如果业务利益干系人投资于更高级别的管理,则该价值可作为成本的基线。
复合 SLO 影响
复合 SLO 影响根据正常运行时间 SLA 的更改提供更新的财务影响。 使用此计算可以比较两种方案的预计财务影响。 复合 SLO 影响在工作簿中标记为 Commitment level impact
。 要在不使用电子表格的情况下计算此预测影响,请应用以下公式:
复合 SLO 影响 = 估计停机时间 × 时间价值影响
该值表示更改后的承诺级别和新的复合 SLO 应防止的潜在损失。
比较基础
比较基础字段评估标准影响和复合 SLO 影响,以确定年度 ROI 字段中的回报量。
损失规避的回报
如果管理工作负载的成本超过了潜在损失,那么拟议的云管理投资可能就不值得了。 要比较避免损失的回报,请参阅标记为 Annual ROI
的列。 若要自行计算此列,请使用以下公式:
避免损失的回报 = (比较基础 - (每月成本 × 12) ) ÷ (每月成本 × 12)
如果没有其他软性成本因素需要考虑,你可以使用这种比较来快速确定你是否需要在云运营、复原能力、可靠性或其他方面投入更多资金。
验证承诺
在此过程中,你的企业可以做出承诺,包括集中式或委托的责任和 Azure 租赁,并确定承诺的级别。 你可以验证和记录每个承诺,以确保云运营团队、云策略团队和业务利益干系人在管理工作负载方面遵守这些承诺。
下一步
在你做出承诺后,负责的运营团队可以配置工作负载。 开始时,请评估各种库存和可见性的方法。