Azure SRE 代理自動化營運工作並降低勞累,讓開發者與營運者能專注於高價值任務。
典型的營運任務通常包括管理多個 Azure 資源,以及本地端和 SaaS 系統。 這些任務常常重複,或需要協調多種工具才能提供所需的洞察。 SRE Agent 提供一個由 AI 驅動的平台,連接系統並自動化流程,從端到端。
什麼是SRE代理人?
SRE Agent 是一項將自動化與智慧應用於現場可靠性工程實務的服務。 它幫助您減少人工作業、提升系統運作時間,並提供一致的營運成果。 由於代理能整合 Azure 服務與外部系統,執行操作任務時幾乎不需要人為介入。
Azure 服務管理功能
SRE 代理可透過 Azure CLI 與 REST API 管理所有 Azure 服務。 此功能包含以下全方位支援:
計算服務:虛擬機、App Service、Container Apps、Azure Kubernetes Service (AKS)、Azure Functions 等
儲存服務:Blob 儲存、檔案分享、管理磁碟與儲存帳號
網路服務:虛擬網路、負載平衡器、應用閘道器及網路安全群組
資料庫服務:Azure SQL 資料庫、Cosmos DB、PostgreSQL、MySQL 與 Redis。
監控與管理:Azure Monitor、日誌分析、應用程式洞察與資源管理器
你可以透過 SRE 代理自動化 Azure CLI 執行的任何操作,透過自訂的執行簿和 子代理。
主要使用案例
自動化事件處理:連接事件管理平台,自動化分流、緩解與解決。 此連接縮短平均恢復時間(MTTR),並提升服務可用性。
自動化排程工作流程:設定主動警示與行動,自動化依固定時程執行的例行且重複性任務。
想觀看 SRE Agent 的實際操作,請觀看以下影片。
SRE 代理是如何運作的?
SRE 代理結合了經過精細調整的 Azure 專業知識與完整的自訂功能。 開箱即用,SRE 代理能理解並管理特定服務的 Azure 資源。 它為常見的操作任務提供智慧的預設值。 同時,它也提供整合領域專屬知識、自訂跑手冊,以及與可觀察性與監控平台等工具與資料來源的整合彈性。
該代理透過多種自動化機制運作,包括:
內建 Azure 知識:對 Azure 服務的預設定理解,並搭配最佳化的操作模式
自訂 runbooks:執行 Azure CLI 指令,以及 REST API 呼叫來操作任何 Azure 服務
子代理擴充性:為特定服務如虛擬機、資料庫或網路元件建置專門代理
外部整合:連接監控、事件管理及原始碼控制系統
這種可擴充性確保 SRE 代理能適應整個 Azure 基礎設施的環境與營運需求。
整合
Azure SRE 代理透過以下方式與您的營運生態系統整合:
監控與可觀察性:
- Azure Monitor(指標、日誌、警報、工作簿)
- Application Insights
- Log Analytics
- Grafana
事件管理:
- Azure 監視器警示
- PagerDuty
- ServiceNow
來源控制與 CI/CD:
- GitHub(倉庫、議題)
- Azure DevOps (儲存庫,工作項目)
資料來源:
- Azure Data Explorer (Kusto)叢集
- 模型內容通訊協定 (MCP) 伺服器
開始
開始使用 Azure SRE 代理,可以排程任務、處理事件,或建立子代理。
Considerations
使用 Azure SRE 代理時,請留意以下幾點:
- 英語是聊天介面中唯一支援的語言。
- 如需如何在 Azure SRE 代理程式中管理數據的詳細資訊,請參閱 Microsoft隱私策略。
- 可用性會因區域和租用戶設定而異。
當你建立代理人時,以下資源也會自動為你建立:
- Azure 應用程式深入解析
- Log Analytics 工作區
- 管理式識別