GPU パーティション分割を使用すると、物理 GPU デバイスを複数の仮想マシン (VM) と共有することができます。 GPU パーティション分割または GPU 仮想化を使用すると、各 VM は GPU 全体ではなく GPU の専用の一部分を取得します。
GPU パーティション分割機能では、 シングル ルート IO 仮想化 (SR-IOV) インターフェイスを使用します。これにより、ハードウェアに基づくセキュリティ境界が提供され、各 VM のパフォーマンスが予測可能になります。 各 VM は、専用の GPU リソースにのみアクセスすることができ、セキュリティで保護されたハードウェア パーティション分割により、他の VM による不正アクセスが防止されます。
Windows Server 2025 以降では、GPU パーティション分割によるライブ マイグレーションがサポートされ、仮想マシンの管理の柔軟性が向上します。 GPU パーティション分割でライブ マイグレーションを利用するには、セットアップがこの記事で説明されている要件を満たしていることを確認します。 ライブ マイグレーションを使用すると、ダウンタイムなしでホスト間で VM を移動できます。これは、運用環境でのメンテナンスと負荷分散に不可欠です。
この機能により、GPU リソースの割り当てを維持しながら計画的な VM 移行が可能になり、ダウンタイムが最小限になり、パフォーマンスが一貫しています。
GPU パーティショニングはスタンドアロン サーバー用に設計されています。 計画的なダウンタイムのために、スタンドアロン ノード間で VM をライブ マイグレーションできます。ただし、計画外のダウンタイムのためにクラスタリングを必要とするお客様は、Windows Server 2025 Datacenter を使用する必要があります。
GPU パーティション分割を使用するタイミング
仮想デスクトップ インフラストラクチャ (VDI)、人工知能 (AI)、機械学習 (ML) 推論などの一部のワークロードには GPU アクセラレーションが必要ですが、GPU パーティション分割は、インフラストラクチャ全体の総所有コストを削減するのに役立ちます。
例えば次が挙げられます。
VDI アプリケーション: 分散エッジをご利用のお客様は、GPU アクセラレーションを必要とする VDI 環境で、Microsoft Office やグラフィックス負荷の高い視覚化ワークロードなどの基本的な生産性アプリを実行します。 このようなワークロードでは、DDA または GPU パーティション分割を使用して必要な GPU アクセラレーションを実現することができます。 GPU パーティション分割を使用すると、複数のパーティションを作成し、VDI 環境をホストしている VM に各パーティションを割り当てることができます。 GPU パーティション分割は、必要な密度を達成し、サポートされるユーザーの数を桁違いに増やすのに役立ちます。
ML を使用した推論: 小売店や製造工場のお客様は、エッジで推論を実行できます。これには、サーバーでの GPU サポートが必要です。 サーバー上で GPU を使用すると、ML モデルを実行して、データがクラウドに送信される前に処理できる結果を迅速に得ることができます。 必要に応じて、ML モデルを再調整して改善し続けるために、データ セット全体を転送することができます。 物理 GPU 全体を VM 専用にする DDA と共に、GPU パーティション分割を使用すると、複数の推論アプリケーションを同じ GPU 上で同時に実行できますが、個別のハードウェア パーティションでは GPU 使用率を最大化できます。
Requirements
ライブ マイグレーションで GPU パーティション分割を使用するには、サポートされている CPU、オペレーティング システム、GPU が必要です。 次のセクションでは、要件について説明します。
CPU 要件
クラスター ホストには、入出力メモリ管理ユニット (IOMMU) DMA ビット追跡対応プロセッサが必要です。 たとえば、Intel VT-D または AMD-Vi をサポートするプロセッサなどです。 IOMMU 対応プロセッサなしで Windows Server とライブ マイグレーションを使用する場合、GPU リソースが利用可能な場所で VM が自動的に再起動されます。
IOMMU DMA ビット追跡をサポートするプロセッサの例を次に示します。
- AMD EPYC 7002 以降 (ミラノ)
- 第 4 世代 Intel Xeon SP (サファイア ラピッズ)
サポートされているゲスト オペレーティング システム
Windows Server 2025 以降の GPU パーティショニングでは、次のゲスト オペレーティング システムをサポートしています。
- Windows 10 以降
- Windows 10 Enterprise マルチセッション以降
- Windows Server 2019 以降
- Linux Ubuntu 18.04 LTS、Linux Ubuntu 20.04 LTS、Linux Ubuntu 22.04 LTS
サポートされている GPU
次の GPU では、GPU パーティション分割がサポートしています。
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
GPU パーティション分割でライブ マイグレーションを使用するには、NVIDIA vGPU Software v18.x 以降に含まれているドライバーを使用する必要があります。 NVIDIA ドライバーは、GPU パーティション分割とライブ マイグレーション機能に必要なサポートを提供します。
OEM (Original Equipment Manufacturer) パートナーと協力して、ワークロードに合わせて調整されたシステムを計画および注文することをお勧めします。 さらに、GPU 独立系ハードウェア ベンダー (IHV) に問い合わせて、セットアップに適切な構成と必要なソフトウェアがあることを確認してください。 ただし、個別のデバイスの割り当て (DDA) を介して GPU アクセラレーションを使用する場合、追加の GPU がサポートされます。 OEM パートナーと IHV に問い合わせて、DDA をサポートする GPU の一覧を取得します。 DDA を介した GPU アクセラレーションの使用について詳しくは、「個別のデバイス割り当て (DDA)」をご覧ください。
パフォーマンスを最大限に高めるには、クラスター内のすべてのサーバーで GPU の同種の構成を作成することをお勧めします。 同種の構成を作成するには、製造元とモデルが同じ GPU をインストールして、クラスター内のすべてのサーバーの GPU で同じパーティション数を構成する必要があります。 たとえば、1 つ以上の GPU がインストールされている 2 台のサーバーのクラスターでは、すべての GPU の製造元、モデル、サイズが同じでなければなりません。 各 GPU のパーティション数も一致している必要があります。
Limitations
GPU パーティション分割機能を使用する場合は、次の制限事項を考慮してください。
構成が同種でない場合、GPU パーティション分割はサポートされません。 サポートされない構成の例を次に示します。
同じクラスター内に異なるベンダーの GPU が混在している。
同じクラスター内で、同じベンダーによる異なる製品ファミリの異なる GPU モデルを使用している。
個別のデバイスの割り当て (DDA) またはパーティション分割可能 GPU の両方として物理 GPU を割り当てることはできません。 DDA またはパーティション分割可能 GPU のいずれかとして割り当てることはできますが、両方を割り当てることはできません。
1 つの VM に複数の GPU パーティションを割り当てると、各パーティションは別の GPU として表示されます。
パーティションは VM に自動的に割り当てられます。 特定の VM の特定のパーティションを選択することはできません。
GPU は、Windows Admin Center または PowerShell を使用してパーティション分割することができます。 Windows Admin Center を使用し、GPU パーティションを構成して割り当てることをお勧めします。 Windows Admin Center では、クラスター内のすべてのサーバーで GPU の同種の構成が自動的に検証されます。 必要な修正アクションを実行するため、適切な警告とエラーが表示されます。
PowerShell を使用して GPU パーティション分割を有効にする場合は、クラスター内の各サーバーで同じ構成手順を実行する必要があります。 クラスター内のすべてのサーバーで GPU に対して同種の構成が維持されるよう手動で確認する必要があります。
GPU パーティションが割り当てられた仮想マシンをライブ マイグレーションする場合、Hyper-V ライブ マイグレーションは自動的に圧縮を伴う TCP/IP の使用に戻ります。 仮想マシンを移行すると、ホストの CPU 使用率が増加する可能性があります。 加えて、ライブ マイグレーションには、GPU パーティションがアタッチされていない仮想マシンより時間がかかる場合があります。
関連コンテンツ
VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。