雲端管理中的清查和可見度

作業管理對資料有明確的相依性。 一致性管理需要了解管理的內容 (清查),以及這些受管理的工作負載和資產隨時間的變化 (可見度)。 清楚了解清查和可見度,有助於讓小組有效地管理環境。 所有其他作業管理活動和程序都是以這兩個領域為基礎。

以下幾個關於測量重要性的經典片語奠定了本文的基調:

  • 管理重要的內容。
  • 您只能管理可測量的內容。
  • 如果無法測量,則可能不重要。

清查和可見度專業領域都是以這些永不過時的片語為基礎。 您必須收集資料並為正確的小組建立正確的可見度層級,才能有效地建立作業管理程序。

常見的客戶挑戰

除非一致套用清查和可見度程序,否則作業管理小組可能會承受更大量的業務中斷、更長的復原時間,以及更大量的問題疑難排解和分級必要工作。 由於變更會對較高優先順序的應用程式和較大量的資產造成負面影響,因此這些計量的增加速度更快。

這些挑戰源自一些只能透過一致資料和遙測讀數回答的問題:

  • 目前狀態效能與標準作業效能遙測的偏離程度為何?
  • 哪些資產會造成工作負載層級的業務中斷?
  • 哪些資產必須補救才能恢復成此工作負載或商務程序可接受的效能?
  • 偏差何時開始? 觸發原因為何?
  • 對基礎資產進行了哪些變更? 變更者是誰?
  • 變更是有意的? 還是惡意的?
  • 變更如何影響效能遙測?

如果沒有豐富的集中式記錄和遙測資料來源,就很難甚至不可能回答這些問題。 為了確保集中資料所需的一致性設定以進行雲端管理,基準服務必須先從定義程序開始。 定義完善的進程會擷取一致的組態如何強制執行資料收集,以支援下一節所列的清查和可見度元件。

清查和可見度的元件

在任何雲端平台上建立可見度都需要一些重要元件:

  • 責任和可見度
  • 清查
  • 集中式記錄
  • 變更追蹤
  • 效能遙測

責任和可見度

當您建立每個工作負載的承諾時,管理責任是一項重要因素。 委派責任會產生委派可見度的需求。 清查和可見度的第一步,是確保負責的各方都能存取正確的資料。 在您實作任何雲端原生工具以取得可見度之前,請確定每個監視工具都有每個作業小組的適當存取權和範圍。

清查

如果沒有人知道資產存在,就很難管理資產。 您必須先清查和分類資產或工作負載,才能進行管理。 穩定作業的第一個步驟是清查和清查分類的驗證。

集中式記錄

集中式記錄對於作業管理小組每日需要的可見度至關重要。 我們建議部署到雲端記錄記錄的所有資產都部署至中央位置。 在 Azure 中,中央位置是 Log Analytics。 中央記錄會報告變更管理、服務健康情況、設定,以及 IT 作業的大部分其他層面。

強制一致使用集中式記錄是建立可重複作業的第一步。 您可以透過公司原則來完成強制執行。 不過,可能的話,您應該自動強制執行以確保一致性。

變更追蹤

變更是技術環境中的一個常數。 感知並了解多個工作負載中的變更對可靠作業而言是必要的。 您的雲端管理解決方案應包含瞭解技術變更的「時機、方式及原因」的方法。 如果沒有這些資料點,補救工作就會受到阻礙。

效能遙測

資料會推動雲端管理的相關商務承諾。 若要適當維護承諾,雲端作業小組必須瞭解工作負載穩定性、效能和作業的相關遙測資料。 雲端作業小組也必須瞭解支援工作負載的資產。

網路、DNS、作業系統及環境其他基本層面的持續健康狀態和作業,都是應列入任何工作負載整體健康狀態考量的重要資料點。

處理序

相較于雲端管理平臺的功能,雲端管理程式在考慮中可能更為重要,因為它們會實現業務營運承諾。 您的雲端管理方法至少應包含下列程式:

  • 回應式監視: 誰解決了對商務營運造成負面影響的偏差? 他們會採取哪些動作來補救偏差?
  • 主動式監視: 偵測到偏差但業務營運不會受到影響時,這些偏差的解決方式,以及由誰處理?
  • 承諾報告:傳達給商務利害關係人之商務承諾的遵守程度為何?
  • 預算審查:針對預算成本審查這些承諾的程序為何? 調整已部署的解決方案或承諾以達成一致性程序為何?
  • 呈報路徑:當上述任何程序無法符合業務需求時,可以使用哪些呈報路徑?

還有其他幾個與清查和可見度相關的程序。 上述清單旨在激發作業小組內部思考。 回答問題清單有助於開發一些必要的程式,而且可能會觸發更深入的新問題。

職責

當您制訂作業監視程序時,確定日常作業責任與每個程序的標準支援,也同樣重要。

  • 在集中式 IT 組織中,IT 會提供作業專業知識。 當問題需要補救時,企業本質上是諮詢的。

  • 在卓越組織的雲端中心,商務營運提供專業知識,並負責管理這些程式。 IT 著重于小組的自動化和支援,因為它們會操作環境。

上述清單專案是常見責任的範例。 組織通常需要混合責任以履行商務承諾。

處理清查和可見度

無論雲端平台為何,您都可以使用清查和可見度的五個元件來推動大部分的作業程序。 所有後續專業領域都以所擷取的資料為基礎。 本系列的後續文章將概述如何處理該資料及整合其他資料來源。

分享可見度

未經處理的資料所能產生的回報有限。 雲端管理可能會擴展到雲端原生工具和程序以外。 為了配合更廣泛的程序,可能需要增強雲端管理基準,以納入報告、IT 服務管理整合或資料集中化。 雲端管理可能需要在作業成熟度的各種階段包含下列一或多個原則。

報告

您通常需要報告與商務利害關係人承諾相關的離線程序與溝通。 自助報告或定期報告可能是增強型管理基準的必要元件。

IT 服務管理 (ITSM) 整合

ITSM 整合通常是處理清查和可見度的第一個範例。 當發生與預期效能模式的偏差時,ITSM 整合會使用來自雲端平臺的警示來觸發個別 ITSM 工具中的票證,以觸發補救活動。 某些作業模型可能需要 ITSM 整合作為增強型管理基準的一部分。

資料集中化

企業在單一雲端提供者內可能需要多個租使用者的原因有很多。 在此情況下,資料集中化是增強型管理基準的必要元件,因為它可讓您查看這些租用戶或環境。

後續步驟

作業合規性是透過套用管理自動化和控制項建置在清查功能之上。 了解作業合規性如何對應到您的程序。