事件的特性和生命週期

已完成

如同在上一個單元中所了解到的,事件是會影響客戶和終端使用者的一種服務中斷。 事件的形式有很多種,其範圍包括令使用者感到受挫的效能降低 (「緩慢是一種新的情緒低落」),以及使服務或網站在一段時間內完全無法使用的系統損毀。

事件的特性

事件通常是非預期的情況,且常會在最糟糕的時間發生 (例如上午 2:00,或您正投入相當重要的專案時)。 這就是為什麼通常大家都會害怕及避免事件,甚至不惜低估事件的顯著性。 組織中內部壓力通常會大到誘使人員對事件進行錯誤的標記,或因為害怕遭到斥責而使其無法報告中斷。

至少,事件會建立並未事先規劃的工作;此外,因為您將大部分時間都花在進行規劃過的工作上,且可能相當了解應該進行的操作,所以可能會認為事件是一種不好的事物。 但是,仍然有另外一種檢視事件的方式:事件實際上是一種「投資」*,因為其可提供您正嘗試傳遞給終端使用者的價值。 無論事件原因為何或其影響的程度為何,所有的事件都有一個共同點:所有事件都可提供寶貴的學習經驗。

您應該將事件視為您的系統的脈搏。 相較於先前對系統的了解,事件會提供更多系統相關資訊,而擁有這項知識是一件好事。 當擁有強大的監視基礎,並深入了解系統中正在發生的狀況時,無可避免地其會產生更多警示和事件,以及進行回應的機會。 事件至少會告知正在發生的情況,並因此可增加作業意識。 在上一個有關監視的課程模組中,我們提到這是可靠性工作的重要前兆。

事件的生命週期

若想要將事件回應小組的狀態提升至「菁英/高階執行者」,則必須停止將服務中斷或事件視為簡單的線性時間軸,並從循環的角度來進行檢視。

您可以將事件的生命週期分成不同的階段,這些階段在邏輯上一個接一個地遵循一個循環,然後回到起點。 每次您進入這個循環時 (而且會這樣做很多次),如果您正確處理它,就有可能會回到起點,對您的系統有更深入的了解。 透過一些刻意進行的工作,您也可以更妥善地做好準備,在下一次發生事件時快速且有效地進行回應。

事件的階段

取決於使用的模型,事件回應程序的個別階段看起來會有些不同。 針對本課程模組,其中包含五個階段,且您會在回應事件時逐一進行這些階段:

  • 偵測:這個階段是此學習路徑中上一個課程模組內監視知識發揮效用的階段。 監視工具會從記錄收集資訊、根據所設定以客戶為中心的目標分析資訊,並傳送可採取動作的警示,讓您了解其需要人為操作。
  • 回應:此階段是在您和小組收到警示後發生的階段。 我們會在本課程模組中深入且詳細地探討這個階段,因此針對此階段稍後會有更多內容。
  • 補救措施:此階段是將系統還原到正常功能的階段。 其操作方式取決於導致服務中斷的原因。 讓服務重新上線及執行,並提供給客戶使用是最優先的事項。 但是,您的作業不會在完成後停止。
  • 「分析」:若要從事件取得持續價值,則必須從事件中學習。 這個階段是收集剛發生事件資訊以及事件期間相關資訊,並透過詢問正確問題以從中學習的程序。 我們針對「從錯誤中學習」有一整個課程模組在討論此階段。
  • 整備程度:您應該將分析階段學到的經驗融入您的作業實務中。 如果有在未來可協助預防發生類似中斷的動作項目,則這些動作項目也應是此階段的一部分。

Cycle diagram of circles labeled with phases from above. Circles are connected to next circle with arrows from phase to phase.

在建立事件回應計劃前,必須了解事件的特性和價值,並熟悉事件生命週期的階段。 下一步是確認回應策略是建置在穩固的基礎上。

檢定您的知識

1.

以下哪一個可以視為系統的「脈動」?

2.

以下哪一項不是事件的階段?