通过


你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

标准化操作的体系结构策略

适用于此 Azure 精心构建的框架卓越运营清单建议:

OE:02 使用标准化作为一种方法,使常规、即席和紧急操作保持一致且可预测。

可预测过程会导致可预测结果。 团队必须标准化工作流程,并始终如一地遵循这些模式。 如果需要,应有意实现自动化以减少可变性。

本指南介绍了团队应如何跨可靠性、安全性、成本优化、性能和日常作定义和维护标准流程。 工作负荷团队拥有这些流程来管理和改进工作负荷,同时与组织治理保持一致。

定义常规任务的可操作的清单

将例程任务分解为易于遵循和重复的简单离散清单项。 每个步骤都应明确定义且可作。

请考虑工作负荷依赖于开源库的用例。 常规任务是应用更新以获取安全修补程序、bug 修复和功能改进。 清单可能包含如下项目:

  • 在较低环境中测试更新
  • 提交生产更改请求
  • 部署更新
  • 更新文档以反映新版本

紧急任务的临时清单

紧急任务因情况而异,但角色、职责和通信路径必须始终清晰。 团队应遵循常规标准和可重用清单,即使对于新任务也是如此。

例如,紧急修复可能会部署新资源。 该部署应使用现有的基础结构即代码标准和标准性能、安全性和可靠性测试。 为了加快响应速度,可以更新清单,以包含有关在授权人员批准的情况下可以跳过低风险、耗时的项目的说明。

对于灾难恢复紧急情况,请严格按照定义的事件响应计划来确保快速协调的行动。 有关此方案的详细信息,请参阅 创建有效的事件管理计划来管理中断

采用适用于工作负载的行业验证做法

使用已建立的做法来减少团队创建流程和标准所花费的时间。 敏捷方法(如 Scrum)、使用看板可视化工作,以及采用向左移动策略已被证明能提高工作流的一致性和效率。 成熟的组织通常依赖于版本控制的 SOP、wiki 和作手册来强制实施标准。

依靠团队的经验来选择适合工作负荷生命周期的做法,并从其他团队那里了解在类似上下文中工作的方法。

AI 机会:若要减少手动工作量并推动一致性,首先使用 Office Copilot 和 GitHub Copilot 规范常见文物的创建和审查。 使用这些工具以一致的方式生成文档、管道定义、测试用例和拉取请求内容。 可以使用第三方工具(例如 SonarQube)来补充这些功能,这些工具为评审方案提供 AI 辅助分析。

采用行业标准的做法有时可能会适得其反。 团队在尝试遵循最佳做法时,可能会花费过多精力来应对合规性、体验挫折和延迟交付价值。 AI 可以帮助检测标准何时阻碍而不是帮助。

请考虑实施 AI 驱动的解决方案来跟踪历史信号,例如在标准、开发人员情绪和缺陷率上花费的时间。 从 LLM (大型语言模型)开始发现模式,然后根据历史数据训练 预测模型 ,以预测标准何时可能会妨碍工作流并采取主动措施。

提前行动,保持主动

鼓励工作负荷团队在安全性、可靠性和成本效益方面完全拥有其工作负载的所有权。 团队应主动识别改进,并将其添加到积压工作中,而不是等待其他团队采取行动。

此策略对于可靠性和安全检查尤其重要。 假设团队不执行探索性测试或获取早期安全检查的所有权,漏洞可能一直未检测到,直到下个月扫描,可能会使工作负荷面临风险。

利用集中式标准和资源

使用既定的组织要求和跨团队标准,而不是从头开始创建新流程。 尽可能采用强制性标准,并在必要时自行构建,并尽可能与其他团队保持一致。 记录团队流程和其他人之间的任何差异,以简化协作,尤其是在安全或合规性等交集点。

请注意合规性要求。 评估过程中可能需要哪些额外步骤来满足这些要求。 了解行业和区域的适用规则,将其嵌入到工作流中,并定期培训团队以确保一致遵守。

在可行的情况下实现自动化

使用自动化来帮助实现一致性。 自动执行重复且容易出错的任务,以减轻团队的管理负担。 寻找实现流程自动化的机会,例如生成 IT 服务管理(ITSM)工单。 有关详细信息,请参阅 实现自动化的建议。

治理开放源代码使用

采用开源工具时要有意。 定义有关何时以及如何使用这些规则的明确规则,确保与组织和合规性要求保持一致。 确定工作负荷团队成员是否可以参与外部开源项目,以及是否可以与其他团队共享内部代码。

权衡:标准有助于保持一致性,但不应僵化。 请遵循过程,同时留出创新空间,以便流程随时间推移安全发展。

记录标准并将其视为生活资产

文档应记录标准操作程序,并明确定义工作的操作方式。 通过创建包含相关工具参考的可操作的检查表,提升文档的有效性。

随着工作负荷和团队的发展,过程必须不断发展,并且应定期审查和挑战标准,以确保它们保持适当。 使用模板和版本控制来保持一致性并保留更新记录。 例如,将运行手册存储在版本控制的存储库中,并要求计划评审作为团队运营节奏的一部分。 包括创作和审阅日期,并突出显示过程中的更改。

AI 机会:使文档与不断演变的资产保持同步,并验证标准符合性需要花费大量精力。 借助 GitHub Copilot 的交互式分析,可以直接从项目资产生成和维护标准文档。 更高级的选项是使用基于标准文档的代理来强制实施合规性并生成遵循这些标准的新资产。 例如,代理可以分析拉取请求、识别偏差、提供反馈,并在适当情况下自动更新代码以符合标准。

Azure 便利化

尽管没有直接促进流程和过程正式化的 Azure 产品,但Microsoft发布了有关本主题的大量指南。 使用本指南了解行业证明和建议的做法,并考虑如何将这些做法应用于工作负荷。

精心构建的框架还提供了有关流程和过程的详细指导,这些流程和过程应进行编编,以确保工作负荷和工作负荷团队按照行业标准运行。

卓越运营清单

请参阅完整的建议集。