云原生
云原生解决方案通过构建应用程序或添加使用云功能实现可伸缩性、复原能力和敏捷性的功能来创造新的业务价值。 本指南提供了一种结构化方法,用于规划与业务目标一致的云原生开发项目,并最大程度地降低交付风险。
在 Azure 上规划云原生解决方案
定义云原生解决方案的业务目标。 从明确、可衡量的业务目标入手,确定约束和成功标准,并验证利益干系人一致性,以确保每个人在项目启动时都有着相同的期望。
定义云原生解决方案的要求。 记录与业务目标相关的功能要求,建立非功能要求,包括可靠性指标和安全基线,以及通过明确定义初始版本的范围与范围外的内容来控制范围。
规划云原生体系结构。 从 Azure 体系结构中心探索经验证的参考体系结构,根据工作负荷特征选择适当的体系结构样式,应用设计最佳做法和云模式,将 Well-Architected 框架的五大支柱集成到设计决策中,规划与现有系统的集成,根据要求选择适当的 Azure 服务和服务层,根据可靠性目标确定区域部署策略,以及包含详细关系图的文档体系结构和设计决策。
规划云原生部署策略。 建立用于部署自动化的 DevOps 做法、通过监视和事件响应过程规划运营就绪情况、定义支持可靠部署的开发做法、对从试点组开始的新工作负荷使用渐进式曝光、使用具有适当部署模式的变更管理流程进行计划功能集成(针对次要更改就地更新、重大更改的蓝绿更新),并为部署后定义所有权和支持责任操作。
定义云原生解决方案的回滚计划。 创建全面的回滚过程,以便快速从部署问题中恢复,并确保在发布活动期间保持业务连续性。
生成云原生解决方案
开发新的云原生解决方案。 在开发过程中应用 Well-Architected 框架原则,在镜像生产的非生产环境中生成,使用 CI/CD 管道实现源代码管理,从一开始就集成 Azure Monitor 和 Application Insights 等监视工具,并通过全面的测试(包括功能、性能、安全性和用户验收测试)来验证解决方案。
创建可重用的基础结构。 建立可一致地跨环境和项目部署的标准化可重复基础结构模式,以减少部署时间并确保配置一致性。
创建部署文档。 记录部署过程、配置和作过程,以实现可靠的部署和向运营团队进行有效的知识转移。
部署云原生解决方案
为云原生部署准备利益干系人。 在开始生产部署之前,宣布部署计划和预期对所有相关利益干系人的影响。 通知支持团队和受影响的组正在发布的内容,以便他们可以处理用户问题。 在部署时段内为功能设置明确的预期,并执行预部署准备评审,以确认所有团队了解其角色并具有必要的访问权限。
执行云原生部署。 使用经过验证的 CI/CD 管道创建生产环境,其中包含在过渡中测试的相同生成项目和 IaC 模板。 执行冒烟测试以验证核心功能和服务可用性。 通过首先向小型用户组公开新系统来实现渐进式推出,然后根据监视结果和用户反馈逐步扩展。
验证部署是否成功。 在基本烟雾测试之外,验证关键用户旅程在实时环境中正常工作。 检查后台进程、集成和计划作业是否正常运行。 查看系统运行状况异常的监视仪表板,并检查警报系统是否有意外触发器。 进行利益干系人签入,仅在对验收标准进行完全验证后才声明部署完成。
在稳定期间支持工作负荷。 与运营团队一起与开发团队一起建立高度的监视和支持态势。 在第一周或两周内连续跟踪系统指标和用户反馈,作为稳定期。 根据观察到的行为调整配置,并记录发现的所有问题。 定义从稳定到标准作的明确退出条件。
在部署后优化云原生解决方案
微调服务配置。 每周应用 Azure 顾问建议来实现关键成本、性能、可靠性和安全性改进。 使用 Well-Architected Framework Azure 服务指南将配置与最佳做法保持一致,并使用 Microsoft Defender for Cloud 立即解决安全发现问题,以维护合规性和保护工作负荷。
验证作准备情况。 通过 Azure Monitor 为所有关键组件启用全面的日志记录和指标,通过模拟故障方案测试警报功能,并查看仪表板以确保它们提供可作的见解。 记录监视范围以支持未来的审核和团队加入。
建立成本监视并优化成本。 在 Azure 中设置自动化成本警报和预算,以根据阈值跟踪支出,在监视、治理、费率、使用情况和组件之间系统地应用 Well-Architected 框架成本优化策略。 定期查看资源利用率模式,以识别和停用未充分利用的资源,同时计划非生产环境在非工作时间关闭。
测试备份和恢复过程。 使用 Azure 备份确认所有关键数据的备份覆盖范围,在非生产环境中执行试用还原,以验证数据完整性和恢复时间目标。 使用分步说明记录基础结构和数据恢复过程,并定期进行灾难恢复演练,以验证团队就绪情况。
收集用户反馈并衡量结果。 通过调查和支持票证分析建立结构化反馈渠道,以确定业务关键型工作流中的痛点。 使用 Azure DevOps 或 GitHub 问题系统地跟踪和解决反馈,并在将解决方案传达回利益干系人时按价值和紧迫性确定优先级。
继续改进和改进。 计划定期 Well-Architected 框架评审,以根据不断变化的要求和使用模式评估体系结构。 使用 Azure Policy 进行治理、自动缩放负载管理和成本异常检测来实现自动化优化,以实现支出控制,同时在组织中共享吸取的教训和最佳做法,推动云成熟度向前发展。
有关详细的云采用框架指南,请参阅 生成云原生解决方案。