摘要

已完成

每個人都會遇到事件發生。 如果您執行任何規模的系統,在某個時間點,它都會失敗而您將面臨中斷情況。 這是事實。 這就是為什麼「事件回應」是 Dickerson 可靠性階層中,緊接在監視之後第二個層級的原因。

那麼問題就會變成:在那些時刻您會有何反應?您是否使用已訂定的計劃或程序來緊急回應,或是否具備臨機操作反應? 我們從優秀的研究中得知,復原時間是高績效組織的其中一項指標。 具備良好的事件回應程序,對於縮短此復原期間非常重要。

在本課程模組中,我們探討了事件的階段,並針對每個階段事件回應探索了計劃的一些重要元件。 我們討論了能夠妥善地追蹤事件的重要性以及使用 Azure 所提供的工具來自動執行該流程的方法。 我們也探討了事件期間溝通的重要層面。 最後,我們探討了一些 Azure 提供的工具,可協助組織在事件補救期間更有效率。