信頼性をサポートするアーキテクチャ設計パターン

ワークロードアーキテクチャを設計するときは、一般的な課題に対処する業界パターンを使用する必要があります。パターンは、ワークロード内で意図的なトレードオフを行い、目的の結果に合わせて最適化するのに役立ちます。また、セキュリティ、パフォーマンス、コスト、運用に影響を与える可能性のある特定の問題に起因するリスクを軽減するのにも役立ちます。軽減されていない場合、これらのリスクは最終的に信頼性の問題を引き起こします。これらのパターンは、実際のエクスペリエンスによって支えられ、クラウドスケールと運用モデル向けに設計されており、本質的にベンダーに依存しません。ワークロード設計を標準化する方法として既知のパターンを使用することは、オペレーショナルエクセレンスの構成要素です。

多くの設計パターンは、1 つ以上のアーキテクチャの柱を直接サポートします。信頼性の柱をサポートする設計パターンは、ワークロードの可用性、自己保持、復旧、データと処理の整合性、および誤動作の封じ込めに優先順位を付けます。

次の表は、信頼性の目標をサポートするアーキテクチャ設計パターンをまとめたものです。

パターン	概要
大使	ネットワーク通信に関連する横断的なタスクをオフロードすることで、ネットワーク通信をカプセル化および管理します。結果のヘルパーサービスは、クライアントに代わって通信を開始します。この仲介ポイントは、再試行やバッファリングなどの信頼性パターンをネットワーク通信に追加する機会を提供します。
フロントエンドのバックエンド	特定のフロントエンドインターフェイス専用の個別のサービスを作成して、ワークロードのサービスレイヤーを個別化します。この分離により、1 つのクライアントをサポートするサービス層の誤動作が、別のクライアントのアクセスの可用性に影響しない可能性があります。さまざまなクライアントを異なる方法で処理する場合は、予想されるクライアントアクセスパターンに基づいて信頼性の取り組みに優先順位を付けることができます。
バルクヘッド	コンポーネント間で意図的かつ完全なセグメント化を導入し、誤動作のブラスト半径を分離します。この障害分離戦略では、問題が生じているバルクヘッドに障害を閉じ込め、他のバルクヘッドへの影響を防ぎます。
キャッシュアサイド	必要に応じて設定されるキャッシュを導入することで、頻繁に読み取るデータへのアクセスを最適化します。その後、同じデータに対する後続の要求でキャッシュが使用されます。キャッシュによってデータレプリケーションが作成され、配信元データストアが一時的に使用できない場合に、頻繁にアクセスされるデータの可用性を維持するために、限られた方法で使用できます。さらに、キャッシュに誤動作がある場合、ワークロードは配信元データストアにフォールバックする可能性があります。
サーキットブレーカー	誤動作または使用できない依存関係に対する継続的な要求を防ぎます。これにより、このパターンによって、障害が発生する依存関係のオーバーロードを防ぐことができます。このパターンを使用して、ワークロードの正常な低下をトリガーすることもできます。サーキットブレーカーは、多くの場合、自己保存と自己復旧の両方を提供するために自動回復と組み合わせています。
クレームチェック	メッセージフローからデータを分離し、メッセージに関連するデータを個別に取得する方法を提供します。メッセージバスは、専用のデータストアに存在する場合と同じ信頼性とディザスターリカバリーを提供しないため、メッセージからデータを分離すると、基になるデータの信頼性が向上する可能性があります。この分離により、障害発生後のメッセージキュー回復アプローチも可能になります。
補正トランザクション	以前に適用されたアクションの影響を逆にして、障害から復旧するメカニズムを提供します。このパターンは、補正アクションを使用して、重要なワークロードパスの誤動作に対処します。これには、データの変更を直接ロールバックしたり、トランザクションロックを解除したり、ネイティブシステムの動作を実行して効果を元に戻したりするなどのプロセスが含まれる場合があります。
競合コンシューマー	分散処理と同時処理を適用して、キュー内の項目を効率的に処理します。このモデルでは、コンシューマーをレプリカとして扱うことでキュー処理の冗長性が構築されるため、インスタンスの障害によって他のコンシューマーがキューメッセージを処理できなくなります。
Edge ワークロードの構成	接続の中断中に構成をローカルで使用できるようにしながら、クラウドを目的の信頼できるソースとして扱うことで、分散エッジワークロードの構成を管理します。このパターンでは、構成の調整、ドリフト検出、ロールバックをサポートして、部分的な更新または無効な構成から復旧することで、信頼性が向上します。
イベントソーシング	状態変更を一連のイベントとして扱い、変更できない追加専用ログにキャプチャします。このパターンは、複雑なビジネスプロセスで信頼性の高い変更履歴が重要な場合に使用できます。また、状態ストアを回復する必要がある場合は、状態の再構築も容易になります。
デプロイスタンプ	テナントまたはワークロードユニットを、共有された運命なしで動作する独立したスタンプに分離します。 1 つのスタンプのエラーは、そのスタンプに含まれており、他のスタンプのテナントには影響しません。リージョン間でスタンプをデプロイすることで、冗長性と復旧計画の基礎も提供されます。
フェデレーテッドアイデンティティ	ユーザーを管理し、アプリケーションの認証を提供するために、ワークロードの外部にある ID プロバイダーに信頼を委任します。ユーザー管理と認証をオフロードすると、これらのコンポーネントの信頼性が ID プロバイダーに移行されます。これは通常、SLA が高くなります。さらに、ワークロードのディザスターリカバリー中に、認証コンポーネントをワークロード回復計画の一部として対処する必要がない可能性があります。
ゲートウェイの統合	1 つの要求で複数のバックエンドサービスへの呼び出しを集計することで、ワークロードとのクライアント操作を簡略化します。このトポロジを使用すると、クライアント間の分散実装から一元化された実装に一時的な障害処理を移行できます。
ゲートウェイオフローディング	要求をバックエンドノードに転送する前と後に、要求処理をゲートウェイデバイスにオフロードします。ゲートウェイにこの責任をオフロードすると、バックエンドノードでのアプリケーションコードの複雑さが軽減されます。場合によっては、オフロードによって、機能が信頼性の高いプラットフォーム提供の機能に完全に置き換えられます。
ゲートウェイルーティング	要求の意図、ビジネスロジック、およびバックエンドの可用性に基づいて、受信ネットワーク要求をさまざまなバックエンドシステムにルーティングします。ゲートウェイルーティングを使用すると、システム内の正常なノードにのみトラフィックをルーティングできます。
Geode	複数の地域にわたってアクティブ/アクティブ可用性モードで動作するシステムをデプロイします。このパターンでは、データレプリケーションを使用して、任意のクライアントが任意の地理的インスタンスに接続できる理想をサポートします。これは、ワークロードが 1 つ以上のリージョンの停止に耐えるのに役立ちます。
ヘルスエンドポイントの監視	その目的のために特別に設計されたエンドポイントを公開することで、システムの正常性または状態を監視する方法を提供します。このエンドポイントを使用して、ワークロードの正常性を管理したり、アラートやダッシュボードを作成したりできます。また、自己修復のシグナルとして使用することもできます。
インデックステーブル	クライアントがメタデータを検索してデータを直接取得できるようにすることで、分散データストアでのデータ取得を最適化し、完全なデータストアスキャンを実行する必要がなくなります。クライアントは参照プロセスを通じてシャード、パーティション、またはエンドポイントを指しているため、このパターンを使用して、データアクセスのフェールオーバーアプローチを容易にすることができます。
リーダー選挙	分散アプリケーションのインスタンスのリーダーを確立します。リーダーは、目標の達成に関連する責任を調整します。このパターンは、作業を確実にリダイレクトすることで、ノードの誤動作の影響を軽減します。また、リーダーが誤動作したときにコンセンサスアルゴリズムを使用してフェールオーバーを実装します。
パイプとフィルター	複雑なデータ処理を一連の独立したステージに分割して、特定の結果を実現します。各ステージの単一の責任により、集中して注意を払い、混同されたデータ処理の混乱を回避できます。
優先順位キュー	優先順位の高い項目が処理され、優先度の低い項目の前に完了するようにします。ビジネスの優先順位に基づいて項目を分離することで、信頼性の取り組みを最も重要な作業に集中させることができます。
Publisher/サブスクライバー	クライアントからサービスへの直接通信を、中間メッセージブローカーまたはイベントバスを介した通信に置き換えることで、アーキテクチャのコンポーネントを分離します。
キューに基づく負荷平準化	受信要求またはタスクのレベルを制御するには、キューにバッファーを設定し、キュープロセッサが制御されたペースで処理できるようにします。この方法では、タスクの到着を処理から切り離すことで、需要の急激な急増に対する回復性を提供できます。また、キュー処理の誤動作を分離して、摂取に影響を与えないようにすることもできます。
レート制限	クライアント要求の速度を制御してスロットリングエラーを減らし、エラー時に無制限に再試行する状況を回避します。この戦術では、サービスが指定された制限に達しないように設計されている場合に、サービスとの通信の制限とコストを確認することで、クライアントを保護します。特定の期間中にサービスに送信される操作の数やサイズを制御することによって機能します。
再試行	特定の操作を制御された方法で再試行することで、一時的または断続的な障害に対処します。分散システムの一時的な障害を軽減することは、ワークロードの回復性を向上させる重要な手法です。
Saga 分散トランザクション	作業をより小さい独立したトランザクションのシーケンスに分解することで、実行時間の長いトランザクションと複雑になる可能性があるトランザクションを調整します。各トランザクションには、実行中のエラーを元に戻し、整合性を維持するための補正アクションも必要です。通常、複数の分散システムにまたがるモノリシックトランザクションは不可能であるため、このパターンは原子性と補正を実装することで一貫性と信頼性を提供します。
スケジューラーエージェントの監督者	システムで監視可能な要因に基づいて、タスクをシステム全体に効率的に分散および再配布します。このパターンでは、異常の影響を軽減するために、正常性メトリックを使用して障害を検出し、正常なエージェントにタスクを再ルーティングします。
シーケンシャルコンボイ	定義された順序で処理をサポートしながら、同時メッセージングイングレスを維持します。このパターンにより、トラブルシューティングが困難な競合状態、問題のあるメッセージ処理、誤った順序のメッセージに対処するためのその他の回避策が排除され、誤動作が発生する可能性があります。
シャーディング	特定の要求を処理する特定の論理宛先に読み込みを指示し、最適化のためのコロケーションを有効にします。データまたは処理はシャードに分離されているため、1 つのシャードの誤動作は、そのシャードに分離されたままです。
ストラングラー Fig	実行中のシステムのコンポーネントを新しいコンポーネントに体系的に置き換えるアプローチを提供します。多くの場合、システムの移行または最新化中です。このパターンの増分アプローチは、移行中のリスクを軽減するのに役立ちます。
調整	リソースまたはコンポーネントへの受信要求のレートまたはスループットに制限を課します。リソースの枯渇を防ぎ、誤動作を引き起こす可能性のある制限を設計できます。このパターンは、グレースフルな低下計画の制御メカニズムとして使用することもできます。

次のステップ

他の Azure Well-Architected Framework の柱をサポートするアーキテクチャ設計パターンを確認します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-30

信頼性をサポートするアーキテクチャ設計パターン

次のステップ

フィードバック

その他のリソース