オペレーショナル エクセレンスの設計レビュー チェックリスト

このチェックリストでは、オペレーショナル エクセレンスの文化を構築するのに役立つ一連の推奨事項を示します。 DevOps アプローチから始めて、複数の規範の特殊化を統合します。 このアプローチにより、厳密な設計と開発のプラクティスが作成されます。 このアプローチにより、インフラストラクチャとコードの繰り返し可能で信頼性が高く、安全なデプロイが実現します。

その恩恵を受ける分野での人間の介入を優先し、他の領域に自動化を組み込みます。 可観測性は、正常性イベントを監視することでオペレーショナル エクセレンスを提供し、現在のワークロードの設計と実装を検証して将来の製品開発に役立ちます。

オペレーショナル エクセレンスのトレードオフと推奨事項を考慮しないと、ワークロードが危険にさらされる可能性があります。 設計の成功に自信を持たさせるために、次のチェックリストで説明されている点を慎重に検討してください。

チェック リスト

  コード 推奨
OE:01 ワークロード チーム メンバーの特殊化を決定し、ワークロード を設計、開発、デプロイ、運用するための堅牢な一連のプラクティスに統合して、仕様に合わせます。 チーム メンバーは、意思決定と責任を明確にし、継続的な改善と最適化を評価し、継続的な学習を組み込む責任のないカルチャを採用する必要があります。
OE:02 ドキュメント、チェックリスト、または自動化を使用して、必要に応じてルーチンの実行方法と緊急時の運用タスクを正式化します。 シフトレフト アプローチなど、業界をリードするプラクティスとアプローチを採用することで、チーム プロセスと成果物の一貫性と予測可能性に努めます。
OE:03 ソフトウェアのアイデアと計画プロセスを形式化する。 確立された業界および組織の標準から引き出します。 一般的な優先順位付けされたバックログと十分に詳細な仕様を使用します。 結果に基づいて、計画プロセスの継続的な改善を推進します。
OE:04
OE:04
OE:04
開発とテストに関する業界で実証済みのプラクティスに従って、ソフトウェア開発と品質保証プロセスを最適化します。 明確なロールの指定については、ツール、ソース管理、アプリケーション設計パターン、ドキュメント、スタイル ガイドなどのコンポーネント間でプラクティスを標準化します。
OE:05 標準化されたコードとしてのインフラストラクチャ (IaC) アプローチを使用して、リソースとその構成を準備します。 他のコードと同様に、一貫したスタイル、適切なモジュール化、品質保証を使用して IaC を設計します。 可能な場合は宣言型のアプローチを使用します。
OE:06 予測可能な自動化されたパイプラインを通じて提案された変更を推進するワークロードサプライ チェーンを構築します。 パイプラインは、環境間でこれらの変更をテストして昇格させます。 サプライ チェーンを最適化して、ワークロードを信頼性が高く、セキュリティで保護し、コスト効率が高く、パフォーマンスを高めます。
OE:07
OE:07
監視システムを設計して実装し、 設計の選択を検証し、将来の設計とビジネス上の決定を通知します。 このシステムは、ワークロードのインフラストラクチャとコードから出力される運用テレメトリ、メトリック、ログをキャプチャして公開します。
OE:08 効果的な緊急業務プラクティスを開発する。 ワークロードがインフラストラクチャとコード全体で意味のある正常性シグナルを出力することを確認します。 結果のデータを収集し、それを使用して、ダッシュボードとクエリを介して緊急対応を実行する実用的なアラートを生成します。 オンコール ローテーション、インシデント管理、緊急リソース アクセス、事後分析の実行など、人間の責任を明確に定義します。
OE:09 人間の介入の洞察と適応性の恩恵を受けない、高度な手続き型であり、自動化投資収益率を生み出す貯蔵寿命を持つすべてのタスクを自動化します。 可能であれば、自動化用とカスタム実装用の既製ソフトウェアを選択します。 すべての自動化をワークロード コンポーネントと同じように扱い、Well-Architected Framework の柱を設計と実装に適用します。
OE:10 ライフサイクルの問題、ブートストラップ、ガバナンスとコンプライアンスガードレールの適用などの運用のための自動化を事前に設計して実装します。 後で自動化をレトロフィットしようとしないでください。 プラットフォームで提供される自動化機能を選択します。
OE:11 ワークロードの安全なデプロイプラクティスを明確に定義します。 小規模で増分的な品質ゲートリリース方法の理想を強調します。 リスクを制御するには、最新のデプロイ パターンと段階的な公開手法を使用します。 定期的な展開と緊急または修正プログラムの展開のアカウント。
OE:12 迅速な復旧に関する予期しないロールアウト途中の問題に対処するデプロイ エラー軽減戦略を実装します。 ロールバック、機能の無効化、デプロイ パターンのネイティブ機能の使用など、複数のアプローチを組み合わせます。

次の手順

オペレーショナル エクセレンスのトレードオフを確認して、他の概念を確認することをお勧めします。