Community Training の信頼性
Community Training は、大規模で広範囲なトレーニング プログラムを高品質かつ効率的に提供できるようにする Azure を活用したクラウドベースのソリューションです。 Community Training を使用すると、あらゆる規模と種類の組織が社内および社外のコミュニティのための大規模なトレーニング プログラムを実行できます。 Community には、現場の労働者、雇用延長者、パートナーのエコシステム、ボランティア ネットワーク、プログラムの受益者などが含まれます。
この記事では、Community Training の信頼性サポートについて説明し、可用性ゾーンによるリージョンの回復性と、ディザスター リカバリーおよび事業継続の両方を取り上げます。 Azure における信頼性の原則の詳細については、Azure の信頼性に関するページを参照してください。
可用性ゾーンのサポート
Azure 可用性ゾーンとは、各 Azure リージョン内にある、3 つ以上に物理的に分離されたデータセンターのグループです。 各ゾーン内のデータセンターには、独立した電源、冷却手段、ネットワーク インフラストラクチャが備わっています。 ローカル ゾーンの障害が発生した場合、可用性ゾーンは、1 つのゾーンが影響を受けたときに、リージョンのサービス、容量、高可用性が残りの 2 つのゾーンによってサポートされるように設計されています。
障害の範囲は、ソフトウェアやハードウェアの障害から、地震、水害、火災などの事象に至る可能性があります。 Azure サービスの冗長と論理的な分離により、障害に対するトレランスが実現されます。 Azure の可用性ゾーンの詳細については、リージョンと可用性ゾーンに関する記事を参照してください。
Azure の可用性ゾーン対応サービスは、適切なレベルの信頼性と柔軟性を提供するように設計されています。 それらは 2 つの方法で構成できます。 それらは、ゾーン間の自動レプリケーションによるゾーン冗長、またはインスタンスを特定のゾーンにピン留めするゾーンベースのいずれかになります。 これらのアプローチを組み合わせることもできます。 ゾーン ベースとゾーン冗長のアーキテクチャを比較した詳細については、「可用性ゾーンとリージョンの使用に関する推奨事項」を参照してください。
Community Training は、Azure 可用性ゾーンを使用して、Azure リージョン内の高可用性とフォールト トレランスを提供します。 Community Training では、次のコントロール プレーンとデータ プレーンの両方の可用性ゾーンがサポートされています。
コントロール プレーンは、可用性のプライマリ リージョンではゾーン冗長です。
データ プレーンは、ニーズに応じた選択によって、ゾーン ベースにもゾーン冗長にもできます。 ただし、ゾーン停止中のデータ損失を回避し、サービスの提供状況を維持するために、ゾーン冗長デプロイを選択することを強くお勧めします。
前提条件
可用性ゾーンは、次の Community Training SKU でサポートされています。
- Standard (比較的小規模なユーザー スケールに対応)
- Premium (大規模なユーザー スケールに対応)
Community Training はペアのリージョンでのみサポートされています。 各セカンダリ リージョンはゾーン構成でデプロイされます。 次の表は、Community Training の可用性ゾーンをサポートするすべてのリージョンと、そのペアのリージョンを示しています。
プライマリ リージョン | ペアのリージョン |
---|---|
UKSouth | UKWest |
オーストラリア東部 | オーストラリア南東部 |
EastUS | WestUS |
EastUS2 | CentralUS |
NorthEurope | 西ヨーロッパ |
WestUS3 | EastUS |
SwedenCentral | SwedenSouth |
ゾーン フェールオーバーのサポート
Community Training では、App Service、Azure SQL などの依存関係のある多くの Azure サービスを使用しています。 ゾーン冗長デプロイを選択すると、Community Training で基盤となる Azure サービス リソースのゾーン冗長オファリングも作成されます。 1 つのゾーンに障害が発生した場合、依存関係リソースを含むすべてのリソースは、正常なゾーンの 1 つにフェールオーバーされます。
可用性ゾーンが有効になっているリソースを作成する
Community Training では、インスタンスの作成時にのみ可用性ゾーンを確保するための構成が提供されます。 インスタンス作成後に可用性ゾーンの構成を変更する場合は、新しいインスタンスを作成する必要があります。 Community Training インスタンスの作成方法については、「Community Training を作成する」を参照してください。
ゾーン ダウン エクスペリエンス
ゾーン ベース。 ゾーン全体の停止中、Community Training は、完全または部分的なサービス停止が発生する可能性があります。 利用可能な範囲は、データセンター全体がダウンしているか、特定の依存関係サービスがそのゾーンで利用できなくなっているかなどの、さまざまな要因によって異なります。
ゾーン冗長。 ゾーン全体の停止中、プロビジョニングされたリソースに影響することはありません。 ただし、それらのリソースとの通信が短時間中断することに備えておく必要があります。 ゾーンがダウンしている状況では、クライアントは 409 エラー コードを受け取り、再試行ロジックは適切な間隔で接続を再確立しようとします。 新しい要求は正常なノードに送信され、ユーザーに影響はありません。 ゾーン全体の停止中に、ユーザーは新しいリソースを作成し、既存のリソースを正常にスケーリングできます。
ディザスター リカバリーと事業継続
ディザスター リカバリー (DR) とは、ダウンタイムやデータ損失につながるような、影響の大きいイベント (自然災害やデプロイの失敗など) から復旧することです。 原因に関係なく、災害に対する最善の解決策は、明確に定義されテストされた DR プランと、DR を積極的にサポートするアプリケーション設計です。 ディザスター リカバリー計画の作成を検討する前に、「ディザスター リカバリー戦略の設計に関する推奨事項」を参照してください。
DR に関しては、Microsoft は共有責任モデルを使用します。 共有責任モデルでは、ベースライン インフラストラクチャとプラットフォーム サービスの可用性が Microsoft によって保証されます。 同時に、多くの Azure サービスでは、データのレプリケート、または障害が発生したリージョンから別の有効なリージョンにクロスレプリケートするフォールバックは、自動的には行われません。 それらのサービスについては、お客様がワークロードに適したディザスター リカバリー計画を設定する必要があります。 Azure PaaS (サービスとしてのプラットフォーム) オファリング上で実行されるほとんどのサービスには、DR をサポートするための機能とガイダンスが用意されており、お客様はサービス固有の機能を使って迅速な復旧をサポートでき、DR 計画の開発に役立ちます。
Microsoft Community Training チームは、Community Training のディザスター リカバリー手順全体を管理しています。 ディザスター リカバリーはアクティブ/アクティブでもアクティブ/パッシブではなく、Azure サービスの最新の利用可能なバックアップに基づいて復旧されます。 Community Training チームは、データ バックアップから、ペアのリージョン内のすべてのリソースを手動で作成します。
Note
Community Training のディザスター リカバリーは、ペアのリージョンでのみサポートされています。
複数リージョンの地域でのディザスター リカバリー
地域的な災害が発生した場合、コントロール プレーンはペアのリージョンに手動でフェールオーバーされます。 フェールオーバーが完了するまでの時間に、サービスの低下が発生する可能性があります。 フェールオーバー後は、ディザスター リージョンがオンラインに戻るまで、読み取り専用操作のみがサポートされます。 オンラインに戻り、すべての操作が再開されたら、手動でサービスを元のリージョンにフェールバックします。 目標復旧時間 (RTO) は 10 分間、回復ポイントの目標 (RPO) は 24 時間を想定しています。
データ プレーンの場合、Community Training では、Microsoft マネージド ディザスター リカバリーが提供されます。 マネージド ディザスター リカバリーを使用するには、Azure の Community Training インスタンス作成中にディザスター リカバリーを有効にする必要があります。 ディザスター リカバリーを有効にすると、Microsoft はペアのリージョンでストレージとデータベースのバックアップを保持します。 目標復旧時間 (RTO) は 12 時間、回復ポイントの目標 (RPO) は 48 時間を想定しています。
Note
RTO は、データベースとストレージのサイズ、ペアになっているリージョン間の待機時間によって異なります。 データベースまたはストレージ VM 容量 (SKU)。 RPO は、Azure SQL や Azure Storage などの基盤となる Azure リソースに依存します。 RTO と RPO の詳細については、「ディザスター リカバリーの概要」を参照してください。
停止の検出、通知、管理
Community Training の正常性チェックでいずれかのサービスの停止が検出されると、どのリージョンでも、Microsoft はペアのリージョンへのフェールオーバーに同意するよう要求します。 Microsoft は、ディザスター リカバリー手続き中に、利用できる機能を通知します。 Microsoft がお客様から同意を受けると、Community Training チームはディザスター リカバリー手続きを開始できます。
重要
学習者は、プライマリ リージョンが操作可能になるまで、オーディオ/ビデオ機能を利用できません。 プライマリ サイトが稼働するまでメディアのアップロード操作を避けることをお勧めします。
容量と予防的なディザスター リカバリーの回復性
Microsoft とお客様は、共有責任モデルの下で活動します。 リージョンがダウンすると、Community Training インスタンスがペアのリージョンに移行されるだけでなく、すべての製品とお客様のワークロードもペアのリージョン委移行されます。 この手続きにより、ペアのリージョンまたはデータセンター内のリソースが不足する可能性があります。 その結果、ディザスター リカバリーの可用性は、基盤となる Azure リソースの使用可能な容量などに依存します。