營運卓越的設計檢閱檢查清單

此檢查清單提供一組建議,可協助您建立卓越營運文化。 從 DevOps 方法開始,整合來自多個專業領域的特製化。 這種方法會建立嚴格的設計和開發做法。 這種方法會導致基礎結構和程式碼的可重複、可靠且安全部署。

優先在受益于它的區域中進行人為介入,並將自動化納入其他領域。 可檢視性可藉由監視健康情況事件來提供卓越營運,以及驗證目前的工作負載設計和實作,以通知未來的軟體發展。

如果您不考慮卓越營運的取捨和建議,您的工作負載可能會有風險。 請仔細考慮下列檢查清單中涵蓋的要點,以確保您設計的成功。

檢查清單

  程式碼 建議
OE:01 決定工作負載小組成員的特製化,並將其整合到一組健全的做法中, 以設計、開發、部署及操作您的工作負載以指定。 小組成員必須清楚做出決策和責任、重視持續改進和優化,並採用併入持續學習的無責任文化。
OE:02 使用檔、檢查清單或自動化,視需要正式執行常式的方式,以及緊急操作工作。 採用領先業界的作法和方法,例如 左移 方法,努力為小組程式與交付專案提供一致性和可預測性。
OE:03 將軟體概念和規劃程式正式化。 從已建立的產業和組織標準中繪製。 使用一般、已排定優先順序的待辦專案,以及足夠詳細的規格。 根據結果,推動規劃程式中的持續改善。
OE:04
OE:04
OE:04
遵循經過業界證明的開發和測試做法,將軟體發展和品質保證程式優化。 如需明確的角色指定,請將工具、原始檔控制、應用程式設計模式、檔和樣式指南等元件之間的做法標準化。
OE:05 使用標準化基礎結構作為程式碼 (IaC) 方法來準備資源及其設定。 與其他程式碼一樣,使用一致的樣式、適當的模組化和品質保證來設計 IaC。 盡可能偏好宣告式方法。
OE:06 建置工作負載供應鏈,以透過可預測的自動化管線推動建議的變更 。 管線會測試並跨環境升級這些變更。 優化供應鏈,讓您的工作負載可靠、安全、符合成本效益且高效能。
OE:07
OE:07
設計和實作監視系統 ,以驗證設計選擇,並通知未來的設計和商務決策。 此系統會擷取並公開從工作負載基礎結構和程式碼發出的作業遙測、計量和記錄。
OE:08 開發有效的緊急作業實務。 請確定您的工作負載會跨基礎結構和程式碼發出有意義的健康情況訊號。 收集產生的資料,並用它來產生可採取動作的警示,以透過儀表板和查詢制定緊急回應。 清楚定義人為責任,例如通話輪替、事件管理、緊急資源存取,以及執行事後分析。
OE:09 自動化所有無法受益于人為介入見解和可調整性的工作、高度程式性,而且具有可產生自動化投資報酬率的存留期。 可能的話,請針對自動化與自訂實作選擇現成的軟體。 將所有自動化視為工作負載元件,並將 Well-Architected 架構要素套用至其設計和實作。
OE:10 針對生命週期考慮、啟動載入,以及套用治理和合規性護欄等作業,預先設計和實作自動化。 請勿稍後嘗試自動化。 選擇平臺提供的自動化功能。
OE:11 清楚定義工作負載的安全部署做法。 強調小型、增量、品質閘道發行方法的理想。 使用新式部署模式和漸進式暴露技術來控制風險。 考慮例行部署和緊急部署,或 Hotfix 部署。
OE:12 實作部署失敗風險降低策略 ,以解決快速復原的非預期中推出問題。 結合多種方法,例如復原、功能停用,或使用部署模式的原生功能。

下一步

建議您檢閱營運卓越取捨,以探索其他概念。