站点可靠性工程文档

站点可靠性工程是一门工程专业，致力于持续帮助组织实现系统、服务和产品的可靠性级别。

video

SRE 简介：什么是 SRE？ (1/3)

video

SRE 简介：核心原则和做法 (2/3)

video

SRE 简介：如何入门 (3/3)

通过现代操作实践提高可靠性

SRE 在线课程

SRE 资源

Azure 上的 SRE

SRE 文档

体系结构

监视

预配和交付

缩放

来自 Microsoft 的 SRE 演讲

区域性

事件响应和事件后审查

监视和可观测性

实践和原则

团队和管理

工具和技术

缩放