Azure Stack HCI のホスト ネットワーク要件
適用対象: Azure Stack HCI、バージョン 22H2、21H2、20H2
このトピックでは、Azure Stack HCI のホスト ネットワークに関する考慮事項と要件について説明します。 データセンターのアーキテクチャおよびサーバー間の物理接続の詳細については、「物理ネットワークの要件」を参照してください。
Network ATC を使用してホスト ネットワークを単純化する方法の詳細については、「Network ATC を使用してホスト ネットワークを単純化する」を参照してください。
ネットワーク トラフィックの種類
Azure Stack HCI のネットワーク トラフィックは、その使用目的によって分類することができます。
- 管理トラフィック: ローカル クラスター外部とのトラフィック。 たとえば、ストレージ レプリカのトラフィックや、リモート デスクトップ、Windows Admin Center、Active Directory などのクラスターを管理するために管理者が使用するトラフィック。
- コンピューティング トラフィック: 仮想マシン (VM) が送信元または送信先となるトラフィック。
- ストレージ トラフィック: 記憶域スペース ダイレクトや SMB ベースのライブ移行など、サーバー メッセージ ブロック (SMB) を使用したトラフィック。 このトラフィックはレイヤー 2 トラフィックであり、ルーティングできません。
重要
ストレージ レプリカでは、非 RDMA ベースの SMB トラフィックが使用されます。 このこと、およびトラフィックの方向性 (南北) は、従来のファイル共有の場合と同様に、上記の "管理" トラフィックと密接に一致します。
ネットワーク アダプターを選択する
ネットワーク アダプターは、その使用がサポートされている ネットワーク トラフィックの種類 (上記参照) によって限定されます。 Windows Server カタログを確認すると、Windows Server 2022 認定に次のロールが 1 つ以上示されるようになっています。 Azure Stack HCI 用のサーバーを購入する前に、管理、コンピューティング、ストレージに適格なアダプターが "少なくとも" 1 つ必要です。この 3 種類のトラフィックすべてが Azure Stack HCI で必要となるためです。 そうすれば、Network ATC を使用して、適切なトラフィックの種類に合わせてアダプターを構成できます。
このロールベースの NIC 適格性の詳細については、こちらのリンクを参照してください。
重要
適格なトラフィックの種類以外のアダプターの使用はサポートされていません。
Level | 管理ロール | コンピューティング ロール | ストレージ ロール |
---|---|---|---|
ロールベースの区別 | 管理 | Compute Standard | Compute Storage |
報奨金の最高額 | 適用できません | Compute Premium | Storage Premium |
注意
このエコシステム内の各アダプターの最高レベルの資格には、Management、Compute Premium、Storage Premium の資格があります。
ドライバーの要件
受信トレイのドライバーは、Azure Stack HCI での使用はサポートされていません。 アダプターで受信トレイのドライバーが使用されているかどうかを確認するには、次のコマンドレットを実行します。 DriverProvider プロパティが Microsoft の場合、アダプターで受信トレイのドライバーが使用されています。
Get-NetAdapter -Name <AdapterName> | Select *Driver*
主なネットワーク アダプター機能の概要
Azure Stack HCI によって使用されるネットワーク アダプターの重要な機能には、次のものがあります。
- 動的仮想マシン マルチキュー (動的 VMMQ または d.VMMQ)
- リモート ダイレクト メモリ アクセス (RDMA)
- ゲスト RDMA
- スイッチが埋め込まれたチーミング (設定)
動的 VMMQ
コンピューティング (Premium) 資格を持つすべてのネットワーク アダプターは、動的 VMMQ をサポートします。 動的 VMMQ では、スイッチ埋め込みチーミングを使用する必要があります。
適用可能なトラフィックの種類: コンピューティング
認定資格が必要です。 コンピューティング (Premium)
動的 VMMQ は、インテリジェントな受信側テクノロジです。 動的 VMMQ は、従来の仮想マシン キュー (VMQ)、仮想 Receive Side Scaling (vRSS)、および VMMQ に基づいて構築されており、次の 3 つの主要な機能強化が行われています。
- 少ない CPU コアを使用してホスト効率を最適化します。
- CPU コアへのネットワーク トラフィック処理を自動チューニングすることで、VM で期待されるスループットを満たして維持できるようにします。
- 予想されるトラフィック量を "バースト" ワークロードで受信できるようにします。
動的 VMMQ の詳細については、ブログ記事「統合アクセラレータ」を参照してください。
RDMA
RDMA は、ネットワーク アダプターに対するネットワーク スタック オフロードです。 これにより、SMB 記憶域トラフィックがオペレーティング システムをバイパスして処理できるようになります。
RDMA は、ホスト CPU リソースの使用を最小限に抑え、高スループットで待機時間の短いネットワークを実現します。 これらのホスト CPU リソースを使用して、追加の VM またはコンテナーを実行できます。
適用可能なトラフィックの種類: ホスト ストレージ
認定資格が必要です。 Storage (Standard)
Storage (Standard) または Storage (Premium) の資格を持つすべてのアダプターは、ホスト側 RDMA をサポートします。 ゲスト ワークロードでの RDMA の使用の詳細については、この記事で後述する「ゲスト RDMA」セクションを参照してください。
Azure Stack HCI では、インターネットワイドエリア RDMA プロトコル (iWARP) または RDMA over Converged Ethernet (RoCE) プロトコル実装のいずれかで RDMA がサポートされます。
重要
RDMA アダプターは、同じ RDMA プロトコル (iWARP または RoCE) を実装する他の RDMA アダプターでのみ機能します。
ベンダーのすべてのネットワーク アダプターが RDMA をサポートしているわけではありません。 次の表に、認定 RDMA アダプターを提供するベンダー (アルファベット順) の一覧を示します。 ただし、この一覧に含まれていないハードウェア ベンダーも RDMA をサポートしています。 WINDOWS Server カタログを参照して、RDMA のサポートを必要とする Storage (Standard) または Storage (Premium) の資格を持つアダプターを見つけます。
Note
InfiniBand (IB) は、Azure Stack HCI. ではサポートされていません。
NIC ベンダー | iWARP | RoCE |
---|---|---|
Broadcom | いいえ | はい |
Intel | Yes | はい (一部のモデル) |
Marvell (Qlogic) | はい | はい |
Nvidia | いいえ | はい |
ホストの RDMA の展開の詳細については、ネットワーク ATC を使用することを強くお勧めします。 手動デプロイの詳細については、 SDN GitHub リポジトリを参照してください。
iWARP
iWARP では伝送制御プロトコル (TCP) を使用します。また、必要に応じて、優先順位ベースのフロー制御 (PFC) と拡張伝送サービス (ETS) を使用して拡張することもできます。
次の場合に iWARP を使用します。
- RDMA ネットワークの管理経験がありません。
- トップ オブ ラック (ToR) スイッチの管理を管理したり、不快に感じたりすることはありません。
- デプロイ後にソリューションを管理しない場合。
- 既に iWARP を使用したデプロイが存在する場合。
- どのオプションを選択したらよいかわからない場合。
RoCE
RoCE は、ユーザー データグラム プロトコル (UDP) を使用しており、信頼性を確保するために PFC と ETS を必要とします。
次の場合に RoCE を使用します。
- データセンターに RoCE を使用したデプロイが既に存在する場合。
- DCB のネットワーク要件を管理することに慣れている場合。
ゲスト RDMA
ゲスト RDMA を使用すると、ホスト上で RDMA を使用する場合と同じ利点を VM の SMB ワークロードで得ることができます。
適用可能なトラフィックの種類: ゲスト ベースのストレージ
認定資格が必要です。 コンピューティング (Premium)
ゲスト RDMA を使用する主な利点は次のとおりです。
- ネットワーク トラフィック処理のための NIC への CPU オフロード。
- 非常に短い待機時間。
- 高スループット。
詳細情報については、SDN GitHub リポジトリからドキュメントをダウンロードしてください。
SET
SET は、Windows Server 2016 以降の Windows Server オペレーティング システムに含まれているソフトウェア ベースのチーミング テクノロジです。 SET には、コンピューティング (Standard) またはコンピューティング (Premium) アダプターが必要です。
適用可能なトラフィックの種類: コンピューティング、ストレージ、管理
認定資格が必要です。 コンピューティング (Standard) またはコンピューティング (Premium)
SET は、Azure Stack HCI でサポートされている唯一のチーミング テクノロジです。 SET は、コンピューティング、ストレージ、管理の各トラフィックで効果的に機能します。
重要
Azure Stack HCI では、以前の負荷分散/フェールオーバー (LBFO) との NIC チーミングはサポートされていません。 Azure Stack HCI の LBFO の詳細情報については、ブログ記事「Azure Stack HCI でのチーミング」を参照してください。
SET は、次を可能にする唯一のチーミング テクノロジであるため、Azure Stack HCI にとって重要です。
- RDMA アダプターのチーミング (必要な場合)。
- ゲスト RDMA。
- 動的 VMMQ。
- その他の主な Azure Stack HCI 機能 (「Azure Stack HCI でのチーミング」を参照)。
SET では、対称 (同一) アダプターを使用する必要があります。 対称ネットワーク アダプターとは、次のものが同じであるアダプターです。
- メーカー (ベンダー)
- モデル (バージョン)
- 速度 (スループット)
- configuration
22H2 では、選択したアダプターが非対称かどうかが Network ATC によって自動的に検出され、通知されます。 アダプターが対称であるかどうかを手動で識別する最も簡単な方法は、速度とインターフェイスの説明が 完全 に一致するかどうかです。 相違が許容されるのは、説明に記載されている数字のみです。 Get-NetAdapterAdvancedProperty
コマンドレットを使用して、報告された構成に必ず同じプロパティ値が表示されるようにします。
次の表で、数字 (#) のみが異なっているインターフェイスの説明の例を確認してください。
名前 | インターフェイスの説明 | リンク速度 |
---|---|---|
NIC1 | ネットワーク アダプター #1 | 25 Gbps |
NIC2 | ネットワーク アダプター #2 | 25 Gbps |
NIC3 | ネットワーク アダプター #3 | 25 Gbps |
NIC4 | ネットワーク アダプター #4 | 25 Gbps |
Note
SET では、動的または Hyper-V ポートの負荷分散アルゴリズムを使用し、スイッチに依存しない構成のみがサポートされます。 最適なパフォーマンスを得るには、Hyper-V ポートは、すべて 10 Gbps 以上で動作する NIC で使用することをお勧めします。 ネットワーク ATC は、SET に必要なすべての構成を行います。
RDMA トラフィックに関する考慮事項
DCB を実装する場合は、ネットワーク スイッチを含むすべてのネットワーク ポート全体で、PFC と ETS の構成が正しく実装されていることを確認する必要があります。 DCB は、RoCE の場合は必須であり、iWARP の場合は省略可能です。
RDMA のデプロイ方法の詳細情報については、SDN GitHub リポジトリからドキュメントをダウンロードしてください。
RoCE ベースの Azure Stack HCI 実装では、ファブリックとすべてのホストで、既定のトラフィック クラスを含む 3 つの PFC トラフィック クラスを構成する必要があります。
クラスター トラフィック クラス
このトラフィック クラスは、クラスターのハートビート用に十分な帯域幅があることを保証します。
- 必須: はい
- PFC 対応: いいえ
- 推奨されるトラフィックの優先順位:優先順位 7
- 推奨される帯域幅予約:
- 10 GbE 以下の RDMA ネットワーク = 2 パーセント
- 25 GbE 以下の RDMA ネットワーク = 1 パーセント
RDMA トラフィック クラス
このトラフィック クラスは、SMB ダイレクトを使用することにより、無損失 RDMA 通信用に十分な帯域幅があることを保証します。
- 必須: はい
- PFC 対応: はい
- 推奨されるトラフィックの優先順位:優先順位 3 または 4
- 推奨される帯域幅予約: 50 パーセント
既定のトラフィック クラス
このトラフィック クラスには、VM トラフィックや管理トラフィックなど、クラスターまたは RDMA のトラフィック クラスで定義されていない他のすべてのトラフィックが記載されています。
- 必須: 既定 (ホストでの構成は不要)
- フロー制御 (PFC) 対応: いいえ
- 推奨されるトラフィック クラス:既定 (優先順位 0)
- 推奨される帯域幅予約:既定 (ホスト構成は不要)
ストレージ トラフィック モデル
SMB には、SMB マルチチャネルなど、Azure Stack HCI 用のストレージ プロトコルとして、多くの利点があります。 SMB マルチチャネルはこの記事では扱いませんが、SMB マルチチャネルが使用できるあらゆるリンクでトラフィックが多重化されていることを理解することが重要です。
Note
複数のサブネットと VLAN を使用して、Azure Stack HCI でストレージ トラフィックを分離することをお勧めします。
次の 4 つのノードを持つクラスターの例を考えてみましょう。 各サーバーには 2 つのストレージ ポート (左側と右側) があります。 各アダプターは同じサブネットと VLAN 上にあるため、SMB マルチチャネルでは、利用可能なすべてのリンクに接続が分散されます。 そのため、最初のサーバー (192.168.1.1) の左側のポートは、2 番目のサーバー (192.168.1.2) の左側のポートに接続します。 最初のサーバー (192.168.1.12) の右側のポートは、2 番目のサーバーの右側のポートに接続します。 3 番目と 4 番目のサーバーにも同様の接続が確立されます。
ただし、これにより、不要な接続が作成され、ToR スイッチに接続するインターリンク (マルチシャーシ リンク アグリゲーション グループまたは MC-LAG) で輻輳が発生します (X 印の部分)。 次の図を参照してください。
推奨されるアプローチは、アダプターのセットごとに個別のサブネットと VLAN を使用する方法です。 次の図では、右側のポートでサブネット 192.168.2.x /24 と VLAN2 が使用されています。 これにより、左側のポートのトラフィックは TOR1 に保持され、右側のポートのトラフィックは TOR2 に保持されます。
トラフィックの帯域幅の割り当て
次の表は、Azure Stack HCI での一般的なアダプター速度を使用した、さまざまな種類のトラフィックの帯域幅割り当ての例を示しています。 これは集中型ソリューションの例であり、すべてのトラフィックの種類 (コンピューティング、ストレージ、管理) が同じ物理アダプター上で実行され、SET の使用によりチーミングされていることに注意してください。
このユース ケースでは、最も多くの制約が課されるため、適切なベースラインとなります。 ただし、これは、アダプターの数と速度の順列を考慮して、サポート要件ではなく、1 つの例として考える必要があります。
この例では、次のことを前提としています。
チームごとに 2 つのアダプターがある。
記憶域バス レイヤー (SBL)、クラスター共有ボリューム (CSV)、Hyper-V (ライブ マイグレーション) トラフィックについて
- 同じ物理アダプターを使用する。
- SMB を使用する。
SMB には DCB を使用して 50% の帯域幅が割り当てられている。
- SBL/CSV は最も優先順位の高いトラフィックであり、SMB 帯域幅の予約の 70 パーセントが割り当てられます。
- ライブ マイグレーション (LM) は
Set-SMBBandwidthLimit
コマンドレットを使用して制限され、残りの帯域幅の 29 パーセントが割り当てられます。ライブ マイグレーションで使用可能な帯域幅が 5 Gbps 以上で、ネットワーク アダプターが対応している場合は、RDMA を使用する。 これを行うには、次のコマンドレットを使用する。
Set-VMHost -VirtualMachineMigrationPerformanceOption SMB
ライブ マイグレーションで使用可能な帯域幅が 5 Gbps 未満の場合は、圧縮を使用してブラックアウト時間を短縮する。 これを行うには、次のコマンドレットを使用する。
Set-VMHost -VirtualMachineMigrationPerformanceOption Compression
ライブ マイグレーション トラフィックに RDMA を使用している場合は、SMB 帯域幅の制限を使用して、ライブ マイグレーション トラフィックが RDMA トラフィック クラスに割り当てられた帯域幅全体を消費できないようにします。 このコマンドレットは 1 秒あたりのバイト数 (Bps) で入力されますが、ネットワーク アダプターは 1 秒あたりのビット数 (bps) で表示されるため注意してください。 次のコマンドレットを使用して、たとえば帯域幅の制限を 6 Gbps に設定します。
Set-SMBBandwidthLimit -Category LiveMigration -BytesPerSecond 750MB
Note
この例の 750 MBps は 6 Gbps に相当します。
以下に、帯域幅の割り当て表の例を示します。
NIC 速度 | チーム化された帯域幅 | SMB 帯域幅予約** | SBL/CSV % | SBL/CSV 帯域幅 | ライブ マイグレーション % | 最大ライブ マイグレーション帯域幅 | ハートビート % | ハートビート帯域幅 |
---|---|---|---|---|---|---|---|---|
10 Gbps | 20 Gbps | 10 Gbps | 70% | 7 Gbps | ** | 200 Mbps | ||
25 Gbps | 50 Gbps | 25 Gbps | 70% | 17.5 Gbps | 29% | 7.25 Gbps | 1% | 250 Mbps |
40 Gbps | 80 Gbps | 40 Gbps | 70% | 28 Gbps | 29% | 11.6 Gbps | 1% | 400 Mbps |
50 Gbps | 100 Gbps | 50 Gbps | 70% | 35 Gbps | 29% | 14.5 Gbps | 1% | 500 Mbps |
100 Gbps | 200 Gbps | 100 Gbps | 70% | 70 Gbps | 29% | 29 Gbps | 1% | 1 Gbps |
200 Gbps | 400 Gbps | 200 Gbps | 70% | 140 Gbps | 29% | 58 Gbps | 1% | 2 Gbps |
* ライブ マイグレーション トラフィックに対する帯域幅の割り当てが 5 Gbps 未満のため、RDMA ではなく圧縮を使用します。
** 50 パーセントは帯域幅予約の一例です。
ストレッチ クラスター
ストレッチ クラスターを使用すると、複数のデータセンターにまたがるディザスター リカバリーを実現できます。 最も単純な形式では、Azure Stack HCI のストレッチ クラスター ネットワークは次のようになります。
ストレッチ クラスターの要件
ストレッチ クラスターには、次の要件と特性があります。
RDMA は単一サイトに限定されており、異なるサイトまたはサブネット間ではサポートされていません。
同じサイト内のサーバーは、同じラックおよびレイヤー 2 の境界内に存在する必要があります。
サイト間のホスト通信ではレイヤー 3 の境界を越える必要があります。ストレッチされたレイヤー 2 のトポロジはサポートされていません。
他のサイトでワークロードを実行するのに十分な帯域幅があること。 フェールオーバーが発生した場合は、代替サイトですべてのトラフィックを実行する必要があります。 使用可能なネットワーク容量の 50 パーセントでサイトをプロビジョニングすることをお勧めします。 ただし、フェールオーバー中のパフォーマンス低下を許容できる場合、これは要件ではありません。
サイト間のレプリケーション (北/南トラフィック) では、ローカル ストレージ (東/西トラフィック) と同じ物理 NIC を使用できます。 同じ物理アダプターを使用している場合は、それらのアダプターを SET とチーミングする必要があります。 また、アダプターには、サイト間のルーティング可能なトラフィック用にプロビジョニングされた追加の仮想 NIC が必要です。
サイト間の通信に使用されるアダプターについて
物理または仮想 (ホスト vNIC) にすることができます。 アダプターが仮想の場合は、物理 NIC ごとに、独自のサブネットと VLAN で 1 つの vNIC をプロビジョニングする必要があります。
サイト間でルーティングできる独自のサブネットと VLAN 上に配置する必要があります。
RDMA は、
Disable-NetAdapterRDMA
コマンドレットを使用して無効にする必要があります。Set-SRNetworkConstraint
コマンドレットを使用し、記憶域レプリカに特定のインターフェイスを使用するように明示的に要求することをお勧めします。記憶域レプリカの追加要件を満たしている必要があります。
ストレッチ クラスターの例
次の例は、ストレッチ クラスター構成を示しています。 特定の仮想 NIC が特定の物理アダプターにマップされるようにするには、Set-VMNetworkAdapterTeammapping コマンドレットを使用します。
次に、ストレッチ クラスター構成の例の詳細を示します。
Note
NIC 名、IP アドレス、VLAN などの正確な構成は、示されているものと異なる場合があります。 これは、お使いの環境に適用できる、参照構成に過ぎません。
SiteA – ローカル レプリケーション、RDMA が有効、サイト間でルーティング不可能
ノード名 | vNIC 名 | 物理 NIC (マップ済み) | VLAN | IP とサブネット | トラフィック スコープ |
---|---|---|---|---|---|
NodeA1 | vSMB01 | pNIC01 | 711 | 192.168.1.1/24 | ローカル サイトのみ |
NodeA2 | vSMB01 | pNIC01 | 711 | 192.168.1.2/24 | ローカル サイトのみ |
NodeA1 | vSMB02 | pNIC02 | 712 | 192.168.2.1/24 | ローカル サイトのみ |
NodeA2 | vSMB02 | pNIC02 | 712 | 192.168.2.2/24 | ローカル サイトのみ |
SiteB – ローカル レプリケーション、RDMA が有効、サイト間でルーティング不可能
ノード名 | vNIC 名 | 物理 NIC (マップ済み) | VLAN | IP とサブネット | トラフィック スコープ |
---|---|---|---|---|---|
NodeB1 | vSMB01 | pNIC01 | 711 | 192.168.1.1/24 | ローカル サイトのみ |
NodeB2 | vSMB01 | pNIC01 | 711 | 192.168.1.2/24 | ローカル サイトのみ |
NodeB1 | vSMB02 | pNIC02 | 712 | 192.168.2.1/24 | ローカル サイトのみ |
NodeB2 | vSMB02 | pNIC02 | 712 | 192.168.2.2/24 | ローカル サイトのみ |
SiteA - ストレッチ レプリケーション、RDMA が無効、サイト間でルーティング可能
ノード名 | vNIC 名 | 物理 NIC (マップ済み) | IP とサブネット | トラフィック スコープ |
---|---|---|---|---|
NodeA1 | Stretch1 | pNIC01 | 173.0.0.1/8 | クロスサイト ルーティング可能 |
NodeA2 | Stretch1 | pNIC01 | 173.0.0.2/8 | クロスサイト ルーティング可能 |
NodeA1 | Stretch2 | pNIC02 | 174.0.0.1/8 | クロスサイト ルーティング可能 |
NodeA2 | Stretch2 | pNIC02 | 174.0.0.2/8 | クロスサイト ルーティング可能 |
SiteB - ストレッチ レプリケーション、RDMA が無効、サイト間でルーティング可能
ノード名 | vNIC 名 | 物理 NIC (マップ済み) | IP とサブネット | トラフィック スコープ |
---|---|---|---|---|
NodeB1 | Stretch1 | pNIC01 | 175.0.0.1/8 | クロスサイト ルーティング可能 |
NodeB2 | Stretch1 | pNIC01 | 175.0.0.2/8 | クロスサイト ルーティング可能 |
NodeB1 | Stretch2 | pNIC02 | 176.0.0.1/8 | クロスサイト ルーティング可能 |
NodeB2 | Stretch2 | pNIC02 | 176.0.0.2/8 | クロスサイト ルーティング可能 |
次の手順
- ネットワーク スイッチと物理ネットワークの要件について学習する。 「物理ネットワークの要件」を参照してください。
- Network ATC を使用してホスト ネットワークを単純化する方法について学習する。 「Network ATC を使用してホスト ネットワークを単純化する」を参照してください。
- フェールオーバー クラスタリング ネットワークの基礎を復習しましょう。
- デプロイについては、Windows Admin Center を使用したクラスターの作成に関する記事を参照してください。
- デプロイについては、Windows PowerShell を使用したクラスターの作成に関する記事を参照してください。