共用方式為


Azure VMware 解決方案工作負載的監視考慮

本文討論Azure VMware 解決方案工作負載的監視設計區域。 此領域著重于可觀察性最佳做法。 本指南適用于營運小組。 Microsoft、VMware 和協力廠商提供各種工具,可讓您用來監視基礎結構和應用程式。 本文列出這些選項。

每個選項都提供各種授權成本、整合選項、監視範圍和支援的監視解決方案。 在使用工具之前,請仔細檢閱適用的條款及條件。

收集基礎結構資料

影響:卓越營運

監視工作負載牽涉到從Azure VMware 解決方案基礎結構和各種 VMware 解決方案元件收集資料。 Azure VMware 解決方案與 VMware 軟體定義的資料中心整合, (SDDC) ,其會執行數個 VMware 解決方案原生元件,例如 VMware Aria。 您可以使用這個工具套件,包括 VMware Aria Operations 來管理基礎結構的各種層面。  

您處置的另一個工具是Azure VMware 解決方案的 VMware vSphere 健全狀況狀態。 此工具可協助確保主動式問題偵測和補救會在您的Azure VMware 解決方案環境中持續執行。 特別是,此工具會在 VMware vSphere 基礎結構中找到設定錯誤,並偵測效能瓶頸。 它也提供資源使用率和整體環境健康情況效能的深入解析。

VMware Aria Operations for Networks 可協助您達到完整的網路可見度、簡化疑難排解程式,以及將網路效能優化。

建議
  • 設定VMware vSphere 健全狀況狀態,以取得Azure VMware 解決方案私人雲端健康情況狀態的高階檢視。
  • 使用VMware Aria Suite之類的協力廠商工具,增強Azure VMware 解決方案私人雲端網路基礎結構的可見度和分析。
  • 使用 Azure 原生監視工具,例如:
    • Azure 監視器。
    • 用於作業監視的 VMware Aria 作業。
    • Azure 原則及其相關聯的儀表板以進行合規性監視。
    • 適用于雲端和 Microsoft Sentinel 的 Microsoft Defender,以進行安全性監視。

記錄管理和封存

影響:卓越營運

若要從 VMware 解決方案元件取得健康情況資料,您需要存取 VMware syslog 服務所收集的記錄。 解決方案元件的範例包括 VMware ESXi、VMware vSAN、VMware NSX-T 資料中心和 VMware vCenter Server。 這些元件的記錄可透過Azure VMware 解決方案基礎結構取得。 Log Analytics 代理程式或擴充功能會將虛擬機器上的客體記錄 (VM) 層級傳送至 Log Analytics。 在Azure VMware 解決方案內,您可以將Azure VMware 解決方案記錄傳送至 Azure 原生儲存體 Blob。 若要將記錄傳送至儲存體 Blob,您可以從集中式 syslog 伺服器設定轉寄站,也可以將 Blob 設定為 Azure 監視器中的目的地。 您也可以使用 Azure Logic Apps 之類的 Azure 原生工具或Azure Functions來轉送記錄。 您可以使用這些工具,從 Azure VMware 解決方案 建立傳入記錄的接聽程式,並將記錄傳送至儲存體 Blob。

封存記錄是將儲存體成本降低的策略。 Azure 儲存體 Blob 和 Log Analytics 可以傳輸記錄以進行長期封存。 使用儲存體 Blob 是成本較低的選項。 但 Log Analytics 具有警示、視覺效果、查詢和取得機器學習式深入解析的進階整合。 當您選擇解決方案時,請考慮您的預算、功能性使用案例和長期使用案例。

建議
  • 從 VMware syslog 服務收集記錄,以從 VMware ESXi、VMware vSAN、VMware NSX-T 資料中心和 VMware vCenter Server 等 VMware 解決方案元件取得健康情況資料。
  • 設定 VMware Aria Operations for Logging 之類的工具,以收集各種記錄以查詢、分析和報告功能。
  • 設定將記錄傳送至長期儲存體的保留持續時間,以減少查詢時間並節省儲存體成本。

監視客體作業系統

影響:卓越營運

在客體作業系統內,計量可用於磁片使用量、應用程式效能、系統資源使用率和使用者活動。 請考慮使用 Azure Arc for Azure VMware 解決方案 (preview) 來管理 Azure 中的 VMware 基礎結構資源。 如需詳細資訊,請參閱部署適用于 Azure VMware 解決方案 的 Azure Arc

建議
  • 啟用客體管理和安裝私人雲端之後,Azure Arc for servers 或 Azure Arc for Azure VMware 解決方案 (preview) 。
  • 安裝額外的代理程式以收集資料,以在Azure VMware 解決方案客體 VM 上啟用客體管理和監視。  

實作安全性監視

影響:安全性、營運卓越

安全性監視對於偵測和回應異常活動非常重要。 在Azure VMware 解決方案私人雲端中執行的工作負載需要橫跨網路、Azure 資源和Azure VMware 解決方案私人雲端本身的完整安全性監視。 您可以藉由部署 Microsoft Sentinel 工作區來集中處理安全性事件。 藉由使用此整合,作業小組可以在更廣泛的組織威脅環境中檢視、分析及偵測安全性事件。

建議
  • 在您用來部署私人雲端 Azure VMware 解決方案的 Azure 訂用帳戶上啟用適用于雲端的 Defender。 確定在適用于雲端的 Defender 方案中, [雲端工作負載保護] ([CWP) ] 設定的 [伺服器] 值為 [開啟 ]。
  • 稽核特殊許可權使用者對私人雲端Azure VMware 解決方案採取的動作。 如需詳細資訊,請參閱特殊許可權身分識別 管理中群組指派的稽核活動歷程記錄
  • 整合 Microsoft Sentinel 與適用于雲端的 Defender。 啟用其資料收集器的安全性事件,並將其與適用于雲端的 Defender 連線。
  • 在 Azure VMware 解決方案 中使用來自已驗證合作夥伴的安全性監視解決方案。

監視和分析網路

影響:安全性、營運卓越

網路監視程式會檢查進入並流出Azure VMware 解決方案私人雲端的所有流量。 在Azure VMware 解決方案中,網路安全性會在網路和主機層上運作。

建議
  • 擷取並監視部署在Azure VMware 解決方案私人雲端中的網路防火牆記錄。 此外,當您的應用程式擴充至 Azure 原生裝置,例如Azure 防火牆或Azure 應用程式閘道時,也會監視部署在 Azure 中的記錄。 如需詳細資訊,請參閱 Azure VMware 解決方案中的防火牆整合
  • 使用Azure 防火牆活頁簿或類似工具來監視與防火牆裝置相關的常見計量和記錄。
  • 將來自多個安全性向量的記錄相互關聯,例如身分識別、網路和基礎結構向量。

設定和簡化警示

影響:營運卓越、成本優化

當您在Azure VMware 解決方案私人雲端中執行工作負載時,您需要有效地監視工作負載效能。 例如,您應該擷取應用程式和基礎結構層的記錄、計量和追蹤要求。

警示可協助您回應效能基準中的變更。 您也可以使用警示來提供必要維護或設定變更的相關資訊。 例如,您可以在金鑰到期、連線遺失,或有超過資源容量的風險時收到通知。

若要讓警示生效,請設定警示,以在符合特定條件時通知責任小組。 也請考慮合併警示,以減少傳送的個別通知數目:

  • 請考慮合併主機、資源群組或叢集的警示,而不是針對空間不足的每部電腦發出警示。
  • 使用此方法也適用于主機問題、CPU 和儲存體尖峰。
  • 以時間範圍為基礎的警示。 例如,如果主機在短時間內發出警示,您可以根據定義的時間閾值來隱藏警示。 例如,您只能在五分鐘之後傳送警示。
建議
  • 討論並建立以效能資料為基礎的基準。
  • 定義相關的警示準則,例如閾值、嚴重性層級或特定條件。
  • 使用 VMware vSphere 事件和警示子系統 來監視 VMware vSphere 並設定觸發程式。
  • 在 Azure VMware 解決方案 中設定 Azure 警示,以即時回應事件。
  • 請確定已設定警示,以便在服務等級協定 (SLA) 授權的層級維護 VMware vSAN 資料存放區寬限空間
  • 設定資源健康情況警示,以取得Azure VMware 解決方案私人雲端的即時健康情況狀態。
  • 使用應用程式效能監視 (APM) 工具來取得應用程式程式碼層級的效能見解。
  • 使用綜合交易、活動訊號監視和端點監視等監視技術的組合。
  • 根據警示對作業的影響或受影響的系統重要性來排定警示的優先順序。 微調警示,只觸發有意義的事件。
  • 若要減少雜訊並有效地管理警示,請使用方法來減少發出的個別通知數目。
  • 若要將警示疲勞降到最低,請採用機制,只通知重要專案關係人有關重大事件。
  • 使用簡訊、電子郵件、推播通知和共同作業平臺等通知通道,例如 Microsoft Teams,以確保有效率地傳遞警示。

管理成本

影響:成本優化、營運卓越

成本監視是指能夠追蹤與私人雲端Azure VMware 解決方案相關聯的成本。

建議
  • 使用 VMware vSphere 事件和警示子系統來監視 VMware vSphere 並設定觸發程式。
  • 設定以 Log Analytics 查詢為基礎的 Azure 警示,以進行Azure VMware 解決方案。 這些警示可協助您的作業小組即時回應預期的非預期事件。

使用疑難排解和偵錯工具

影響:成本優化、營運卓越

若要有效率地對應用程式進行偵錯和疑難排解,您需要記錄、計量和相關資訊。 這項資訊包含事件活動,讓您能夠識別、分析及建立事件之間的連線。

建議
  • 將您的系統設定為將記錄從 Azure VMware 解決方案 syslog 服務轉送至 Log Analytics。 轉送所有相關記錄、計量和診斷資訊。
  • 在Azure VMware 解決方案私人雲端內執行的客體 VM 上,設定 Azure Arc 所啟用的伺服器代理程式。

使用儀表板

影響:營運卓越

應用程式儀表板可協助您視覺化及監視應用程式的效能、健康情況和其他計量:

  • 儀表板中的監視報告可協助您快速進行根本原因分析和疑難排解。 作業小組可以使用這些儀表板來檢視組成單一窗格中Azure VMware 解決方案的所有重要資源。
  • 儀表板計量可讓您深入瞭解程式碼和基礎結構變更如何影響應用程式行為。
  • 視覺效果可協助客戶支援小組瞭解應用程式變更、效能和可用性問題的影響。
  • 效能指標可讓主管領導階層和企業專案關係人受益。 這些工具會通知決策,讓應用程式的效能與商務目標保持一致。 例如,主管可以檢閱服務可用性、事件解決時間和平均回應時間等計量,以監視對客戶的承諾。 這些計量有助於確保組織根據其 SLA 提供服務。

除了提供深入解析,儀表板也可以提升透明度,並鼓勵共同作業,例如,當您授與適當的專案關係人存取應用程式儀表板時。 此動作會培養應用程式效能的共用理解。 此做法也可讓組織做出明智的決策。 因此,專案關係人可以專注于推動業務向前的重要計畫。

建議
  • 使用 Application Insights 或 Grafana 建置應用程式儀表板。 將儀表板連線到儲存您Azure VMware 解決方案環境計量的相關資料來源。
  • 建立 Azure 活頁簿作為常用查詢、計量和互動式報表的中央存放庫。
  • 請確定您的資料來源符合安全性和合規性需求。
  • 定義存取控制和許可權,例如使用者驗證和角色型存取控制。 確定每個專案關係人都有根據其角色的適當存取權。
  • 定期進行存取權檢閱,以檢查使用者存取權是否為最新狀態,並符合目前的角色和責任。

後續步驟

既然您已在Azure VMware 解決方案中查看可觀察性最佳做法,請探索可用來進一步保護 SDDC 中工作負載的機制、工具和周邊。

使用評定工具來評估您的設計選擇。