共用方式為


Azure SRE Agent 預覽的概觀

Azure SRE 代理自動化營運工作並降低勞累,讓開發者與營運者能專注於高價值任務。

典型的營運任務通常包括管理多個 Azure 資源,以及本地端和 SaaS 系統。 這些任務常常重複,或需要協調多種工具才能提供所需的洞察。 SRE Agent 提供一個由 AI 驅動的平台,連接系統並自動化流程,從端到端。

什麼是SRE代理人?

SRE Agent 是一項將自動化與智慧應用於現場可靠性工程實務的服務。 它幫助您減少人工作業、提升系統運作時間,並提供一致的營運成果。 由於代理能整合 Azure 服務與外部系統,執行操作任務時幾乎不需要人為介入。

Azure 服務管理功能

SRE 代理可透過 Azure CLI 與 REST API 管理所有 Azure 服務。 此功能包含以下全方位支援:

  • 計算服務:虛擬機、App Service、Container Apps、Azure Kubernetes Service (AKS)、Azure Functions 等

  • 儲存服務:Blob 儲存、檔案分享、管理磁碟與儲存帳號

  • 網路服務:虛擬網路、負載平衡器、應用閘道器及網路安全群組

  • 資料庫服務:Azure SQL 資料庫、Cosmos DB、PostgreSQL、MySQL 與 Redis。

  • 監控與管理:Azure Monitor、日誌分析、應用程式洞察與資源管理器

你可以透過 SRE 代理自動化 Azure CLI 執行的任何操作,透過自訂的執行簿和 子代理

主要使用案例

  • 自動化事件處理:連接事件管理平台,自動化分流、緩解與解決。 此連接縮短平均恢復時間(MTTR),並提升服務可用性。

  • 自動化排程工作流程:設定主動警示與行動,自動化依固定時程執行的例行且重複性任務。

想觀看 SRE Agent 的實際操作,請觀看以下影片。


SRE 代理是如何運作的?

SRE 代理結合了經過精細調整的 Azure 專業知識與完整的自訂功能。 開箱即用,SRE 代理能理解並管理特定服務的 Azure 資源。 它為常見的操作任務提供智慧的預設值。 同時,它也提供整合領域專屬知識、自訂跑手冊,以及與可觀察性與監控平台等工具與資料來源的整合彈性。

該代理透過多種自動化機制運作,包括:

  • 內建 Azure 知識:對 Azure 服務的預設定理解,並搭配最佳化的操作模式

  • 自訂 runbooks:執行 Azure CLI 指令,以及 REST API 呼叫來操作任何 Azure 服務

  • 代理擴充性:為特定服務如虛擬機、資料庫或網路元件建置專門代理

  • 外部整合:連接監控、事件管理及原始碼控制系統

這種可擴充性確保 SRE 代理能適應整個 Azure 基礎設施的環境與營運需求。

整合

Azure SRE 代理透過以下方式與您的營運生態系統整合:

  • 監控與可觀察性:

    • Azure Monitor(指標、日誌、警報、工作簿)
    • Application Insights
    • Log Analytics
    • Grafana
  • 事件管理:

    • Azure 監視器警示
    • PagerDuty
    • ServiceNow
  • 來源控制與 CI/CD:

    • GitHub(倉庫、議題)
    • Azure DevOps (儲存庫,工作項目)
  • 資料來源:

    • Azure Data Explorer (Kusto)叢集
    • 模型內容通訊協定 (MCP) 伺服器

開始

開始使用 Azure SRE 代理,可以排程任務、處理事件,或建立子代理。

建立一個排程任務,依照你定義的排程執行。

  1. 選擇 「排程任務 」標籤。

  2. 輸入任務細節。

  3. 定義執行任務的排程。

  4. 為任務創建客製化客服代理說明。

  5. 選擇 建立排程工作

Considerations

使用 Azure SRE 代理時,請留意以下幾點:

  • 英語是聊天介面中唯一支援的語言。
  • 如需如何在 Azure SRE 代理程式中管理數據的詳細資訊,請參閱 Microsoft隱私策略
  • 可用性會因區域和租用戶設定而異。

當你建立代理人時,以下資源也會自動為你建立:

  • Azure 應用程式深入解析
  • Log Analytics 工作區
  • 管理式識別

後續步驟