vSAN ストレッチクラスターを設計する

2024-12-24

この記事では、Azure VMware Solution プライベートクラウド用に vSAN ストレッチクラスターを設計する方法について説明します。

背景

Azure のグローバルインフラストラクチャはリージョンに分かれています。各リージョンは、特定の地域のサービスをサポートしています。各リージョン内では、可用性ゾーン (AZ) と呼ばれる、冗長性を持つ孤立したインフラストラクチャ領域が Azure によって構築されます。 AZ は、リソース管理の境界として機能します。 AZ で使用できるコンピューティングとその他のリソースは有限であり、顧客の要求によって使い果たされる可能性があります。 AZ は個別に回復性を持つように構築されています。つまり、1 つの AZ の障害は他の AZ には影響しません。

Azure VMware Solution では、標準の vSphere クラスターにデプロイされた ESXi ホストは、従来は単一の Azure 可用性ゾーン (AZ) に存在し、vSphere 高可用性 (HA) によって保護されます。ただし、ワークロードは Azure AZ の障害から保護されません。 AZ 障害から保護するために、1 つの vSAN クラスターが vSAN ストレッチクラスターと呼ばれる 2 つの個別の可用性ゾーンにまたがるようにできます。

ストレッチクラスターを使用すると、2 つの AZ にまたがる vSAN 障害ドメインを構成して、ホストが各可用性ゾーン (AZ) に存在することを vCenter Server に通知できます。わかりやすくするために、各障害ドメインには、そのドメインが存在する AZ の名前が付けられます。 1 つのリージョン内の 2 つの AZ に vSAN クラスターを拡張した場合、AZ がダウンすると vSphere HA イベントとして扱われ、もう一方の AZ で仮想マシンが再起動されます。

ストレッチクラスターの利点:

アプリケーションの可用性を向上させます。
エンタープライズアプリケーションの再設計や、高価なディザスターリカバリー (DR) ソリューションをデプロイすることなく、回復ポイントの目標 (RPO) 機能をゼロにできます。
ストレッチクラスターを備えたプライベートクラウドは、AZ 障害に対する回復性があるため、99.99% の可用性を提供するように設計されています。
お客様がインフラストラクチャの可用性ではなく、主要なアプリケーション要件と機能に集中できるようにします。

スプリットブレインシナリオから保護し、サイトの正常性を測定するために、マネージド vSAN Witness が 3 番目の AZ に作成されます。各 AZ のデータのコピーを使用して、vSphere HA は仮想マシンの再起動を使用して、障害からの復旧を試みます。

次の図は、2 つの AZ にまたがって拡張された vSAN クラスターを示しています。

次の図は、2 つの AZ にまたがる vSAN クラスター内のネットワークトラフィックの通常のフローを示しています。

要約すると、ストレッチクラスターは、Azure インフラストラクチャのスケールと柔軟性に加えて、同じ信頼できる制御と機能を提供することで、保護のニーズを簡素化します。

ストレッチクラスターのプライベートクラウドは、回復性の追加レイヤーを提供するだけで、すべての障害シナリオに対処するわけではないことを理解することが重要です。たとえば、ストレッチクラスターのプライベートクラウドは次のように機能します。

Azure 内のリージョンレベルの障害や、アプリケーションの問題や計画が不十分なストレージポリシーによって発生するデータ損失シナリオへの保護は行いません。
単一のゾーンの障害に対する保護は提供しますが、二重の障害や進行する障害に対する保護を提供するようには設計されていません。例:
- ファブリックにさまざまな冗長性の層が組み込まれていても、AZ 間障害によってセカンダリサイトのパーティション分割が発生した場合、vSphere HA はセカンダリサイト上のワークロード VM の電源オフを開始します。
  
  次の図は、セカンダリサイトのパーティション分割シナリオを示しています。
- セカンダリサイトのパーティション分割が代わりにプライマリサイトの障害に発展した場合、または完全なパーティション分割が発生した場合、vSphere HA はセカンダリサイト上のワークロード VM の再起動を試みます。 vSphere HA がセカンダリサイト上のワークロード VM を再起動しようとすると、ワークロード VM は不安定な状態になります。
  
  次の図は、優先されるサイトの障害および完全なネットワークパーティション分割シナリオを示しています。
  
  次の図は、完全なサイト障害時に拡張された vSAN クラスター内のネットワークトラフィックのフローを示しています。

これらの種類の障害はまれですが、ストレッチクラスターのプライベートクラウドによって提供される保護の範囲外になることに注意してください。このようなまれな障害のため、ストレッチクラスターソリューションは vSphere HA に依存するマルチ AZ 高可用性ソリューションと見なす必要があります。ストレッチクラスターソリューションは、アプリケーションの可用性を確保するために使用できる包括的なマルチリージョンディザスターリカバリー戦略を置き換えることを意図していないことを理解しておくことが重要です。その理由は、ディザスターリカバリーソリューションには通常、個別の Azure リージョンに個別の管理プレーンとコントロールプレーンがあるためです。 Azure VMware Solution のストレッチクラスターでは、同じ Azure リージョン内の 2 つの可用性ゾーンにまたがって 1 つの管理プレーンとコントロールプレーンが拡張されます。たとえば、1 つの vCenter Server、1 つの NSX Manager クラスター、1 つの NSX Edge VM ペアなどです。

ストレッチクラスター地域の可用性

Azure VMware Solution ストレッチクラスターは、次のリージョンで使用できます。

英国南部 (AV36およびAV36Pに関して)
西ヨーロッパ (AV36 および AV36P 上)
ドイツ中西部 (AV36 と AV36P 上)
オーストラリア東部 (AV36P 上)
米国東部 (AV36P 上)

サポートされているストレージポリシー

次の SPBM ポリシーがサポートされており、クラスターの既定のポリシーとして PFTT の "デュアルサイトミラーリング" と "RAID 1 (ミラーリング)" の SFTT が有効になっています。

サイトのディザスタートレランス設定 (PFTT):
- デュアルサイトミラーリング
- なし - 優先にデータを保持する
- なし - 非優先にデータを保持する
許容するローカルエラー (SFTT):
- 1 つの障害 – RAID 1 (ミラーリング)
- 1 つの障害 – RAID 5 (イレイジャーコーディング)、各 AZ で少なくとも 4 つのホストが必要
- 2 つの障害 – RAID 1 (ミラーリング)
- 2 つの障害 – RAID 6 (イレイジャーコーディング)、各 AZ で少なくとも 6 つのホストが必要
- 3 つの障害 – RAID 1 (ミラーリング)

よく寄せられる質問

他のリージョンは計画されていますか?

現在、ストレッチクラスターは、5 つのリージョンでサポートされています。

ストレッチクラスターではどのような種類の SLA が Azure VMware Solution によって提供されますか?

vSAN ストレッチクラスターを使用して作成されたプライベートクラウドは、次の条件が存在する場合に 99.99% のインフラストラクチャ可用性コミットメントを提供するように設計されています。

少なくとも 6 つのノードがクラスターにデプロイされている場合 (各可用性ゾーンに 3 つ)。
"デュアルサイトミラーリング" の PFTT の VM ストレージポリシーと 1 の SFTT がワークロード VM で使用されている場合。
可用性の目標を達成するために、Azure VMware Solution の SLA の詳細でキャプチャされた追加要件への準拠が必要な場合。

プライベートクラウドがデプロイされている可用性ゾーンを選択できますか?

いいえ。ストレッチクラスターは 2 つの可用性ゾーンの間に作成され、3 つ目のゾーンはミラーリング監視ノードのデプロイに使用されます。すべてのゾーンはストレッチクラスター環境のデプロイに実質的に使用されるため、お客様に選択肢は提供されません。代わりに、お客様はプライベートクラウドの作成時に複数の AZ にホストをデプロイすることを選択します。

注意すべき制限事項は何ですか?

ストレッチクラスターを使用してプライベートクラウドを作成した後は、標準クラスターのプライベートクラウドに変更することはできません。同様に、作成後に標準のクラスターのプライベートクラウドをストレッチクラスターのプライベートクラウドに変更することはできません。
ストレッチクラスターのスケールアウトとスケールインは、ペアでのみ行うことができます。ストレッチクラスター環境では、最小で 6 個、最大で 16 個のノードがサポートされます。詳細については、「Azure サブスクリプションとサービスの制限、クォータ、制約」をご覧ください。
お客様のワークロードVMは、中程度の優先度のvSphere HAとして再起動されます。管理 VM の再起動優先度は最も高くなります。
このソリューションの再起動とレプリケーションは vSphere HA と vSAN に依存します。目標復旧時間 (RTO) は、1 つの AZ で障害が発生した後、残っている AZ 上の VM を再起動するのに vSphere HA でかかる時間によって決まります。
現在、次のような機能は、ストレッチクラスター環境ではサポートされていません。
- パブリック IP から NSX Edge のような最近リリースされた機能、および ANF データストアなどの外部ストレージ。
- VMware SRM、Zerto、JetStream などのディザスターリカバリーアドオン。
次のシナリオで Azure portal からサポートチケットを開きます ([問題の種類] として [ストレッチクラスター] を選択してください)。
- プライベートクラウドをストレッチクラスターのプライベートクラウドに接続する。
- 1 つのリージョン内の 2 つのストレッチクラスターのプライベートクラウドを接続する。

可用性ゾーン (AZ) 間で予想される待機時間はどの程度ですか?

vSAN ストレッチクラスターは、ワークロード VM をホストする AZ 間で、5 ミリ秒のラウンドトリップ時間 (RTT) と、10 Gb/秒以上の帯域幅で動作します。 Azure VMware Solution ストレッチクラスターのデプロイは、その基本原則に従います。待機時間の要件が厳しいアプリケーション (同期書き込みを使用するデュアルサイトミラーリングの SFTT を使用) を展開する場合は、その情報を考慮してください。

プライベートクラウドでストレッチクラスターと標準クラスターを混在させることができますか?

いいえ。ストレッチクラスターと標準クラスターの組み合わせは、同じプライベートクラウド内ではサポートされていません。プライベートクラウドを作成するときに、ストレッチクラスター環境または標準クラスター環境が選択されます。ストレッチクラスターを使用してプライベートクラウドが作成されると、そのプライベートクラウド内で作成されたすべてのクラスターは本質的にストレッチであると想定されます。

ソリューションのコストはどれくらいですか?

お客様は、プライベートクラウド内にデプロイされたノードの数に基づいて課金されます。

ミラーリング監視ノードと AZ 間トラフィックに対して課金されますか?

いいえ。お客様は、ミラーリング監視ノードと AZ 間トラフィックに対しては課金されません。ミラーリング監視ノードは完全にサービス管理で、Azure VMware Solution はミラーリング監視ノードの必要なライフサイクル管理を提供します。ソリューション全体がサービス管理であるため、お客様に必要なのはワークロード仮想マシンに対して設定する適切な SPBM ポリシーを識別することだけです。それ以外は Microsoft によって管理されます。

次の方法で共有

vSAN ストレッチ クラスターを設計する

背景

ストレッチクラスター地域の可用性

サポートされているストレージ ポリシー

よく寄せられる質問

他のリージョンは計画されていますか?

ストレッチ クラスターではどのような種類の SLA が Azure VMware Solution によって提供されますか?

プライベート クラウドがデプロイされている可用性ゾーンを選択できますか?