GPU パーティション分割

[アーティクル]
04/18/2024

適用先: Windows Server 2025 (プレビュー)

重要

Windows Server 2025 での GPU パーティション分割はプレビュー段階です。この情報はプレリリース製品に関連するものであり、リリース前に大幅に変更される可能性があります。ここに記載された情報について、Microsoft は明示か黙示かを問わずいかなる保証をするものでもありません。

適用対象: Azure Stack HCI バージョン 23H2 および 22H2

GPU パーティション分割を使用すると、物理 GPU デバイスを複数の仮想マシン (VM) と共有することができます。 GPU パーティション分割または GPU 仮想化を使用すると、各 VM は GPU 全体ではなく GPU の専用の一部分を取得します。

GPU パーティション分割機能では、シングルルート IO 仮想化 (SR-IOV) インターフェイスを使用します。これにより、ハードウェアに基づくセキュリティ境界が提供され、各 VM のパフォーマンスが予測可能になります。各 VM は、専用の GPU リソースにのみアクセスすることができ、セキュリティで保護されたハードウェアパーティション分割により、他の VM による不正アクセスが防止されます。

Windows Server には、GPU パーティション分割によるライブマイグレーションが導入されています。 GPU パーティション分割ライブマイグレーションを使用するには、一定の要件があります。推奨されるライブマイグレーションのベストプラクティスとは別に、クラスターホストには入出力メモリ管理ユニット (IOMMU) DMA ビット追跡対応プロセッサが必要です。たとえば、Intel VT-D または AMD-Vi をサポートするプロセッサなどです。 IOMMU 対応プロセッサなしで Windows Server とライブマイグレーションを使用した場合、VM は自動的に再起動され、GPU リソースが使用可能な場所に配置されます。

GPU パーティション分割を使用するタイミング

仮想デスクトップインフラストラクチャ (VDI)、人工知能 (AI)、機械学習 (ML) 推論などの一部のワークロードには GPU アクセラレーションが必要ですが、GPU パーティション分割は、インフラストラクチャ全体の総所有コストを削減するのに役立ちます。

次に例を示します。

VDI アプリケーション: 分散エッジをご利用のお客様は、GPU アクセラレーションを必要とする VDI 環境で、Microsoft Office やグラフィックス負荷の高い視覚化ワークロードなどの基本的な生産性アプリを実行します。このようなワークロードでは、DDA または GPU パーティション分割を使用して必要な GPU アクセラレーションを実現することができます。 GPU パーティション分割を使用すると、複数のパーティションを作成し、VDI 環境をホストしている VM に各パーティションを割り当てることができます。 GPU パーティション分割は、必要な密度を達成し、サポートされるユーザーの数を桁違いに増やすのに役立ちます。
ML を使用した推論: 小売店や製造工場のお客様は、エッジで推論を実行できます。これには、サーバーでの GPU サポートが必要です。サーバー上で GPU を使用すると、ML モデルを実行して、データがクラウドに送信される前に処理できる結果を迅速に得ることができます。必要に応じて、ML モデルを再調整して改善し続けるために、データセット全体を転送することができます。物理 GPU 全体を VM に割り当てる DDA に加えて、GPU パーティション分割を使用すると、複数の推論アプリケーションを同じ GPU 上で並列に実行し、別々の物理パーティションで実行できるため、GPU を最大限に活用することができます。

サポートされているゲストオペレーティングシステム

Windows Server における GPU パーティション分割では、次のゲストオペレーティングシステムがサポートされています。

Azure Stack HCI における GPU パーティション分割では、次のゲストオペレーティングシステムがサポートされています。

Windows 10 またはそれ以降
Windows 10 Enterprise マルチセッション以降
Windows Server 2019 またはそれ以降
Linux Ubuntu 18.04 LTS、Linux Ubuntu 20.04 LTS

サポートされている GPU

次の GPU では、GPU パーティション分割がサポートしています。

NVIDIA A2
NVIDIA A10
NVIDIA A16
NVIDIA A40
NVIDIA L4
NVIDIA L40
NVIDIA L40S

OEM (相手先ブランド供給) パートナーおよび GPU 独立系ハードウェアベンダー (IHV) と協力し、適切な構成と必要なソフトウェアを使用した目的のワークロードのシステムを計画、発注、セットアップすることをお勧めします。ただし、個別のデバイスの割り当て (DDA) または GPU パススルーを介して GPU アクセラレーションを使用する場合、追加の GPU がサポートされます。 OEM パートナーと IHV に問い合わせて、DDA をサポートする GPU の一覧を取得します。 DDA を介した GPU アクセラレーションの使用について詳しくは、「個別のデバイス割り当て (DDA)」をご覧ください。

パフォーマンスを最大限に高めるには、クラスター内のすべてのサーバーで GPU の同種の構成を作成することをお勧めします。同種の構成を作成するには、製造元とモデルが同じ GPU をインストールして、クラスター内のすべてのサーバーの GPU で同じパーティション数を構成する必要があります。たとえば、1 つ以上の GPU がインストールされている 2 台のサーバーのクラスターでは、すべての GPU の製造元、モデル、サイズが同じでなければなりません。各 GPU のパーティション数も一致している必要があります。

制限事項

GPU パーティション分割機能を使用する場合は、次の制限事項を考慮してください。

構成が同種でない場合、GPU パーティション分割はサポートされません。サポートされない構成の例を次に示します。
- 同じクラスター内に異なるベンダーの GPU が混在している。
- 同じクラスター内で、同じベンダーによる異なる製品ファミリの異なる GPU モデルを使用している。
個別のデバイスの割り当て (DDA) またはパーティション分割可能 GPU の両方として物理 GPU を割り当てることはできません。 DDA またはパーティション分割可能 GPU のいずれかとして割り当てることはできますが、両方を割り当てることはできません。
VM に割り当てることができる GPU パーティションは 1 つだけです。
パーティションは、VM に自動的に割り当てられます。特定の VM の特定のパーティションを選択することはできません。

現時点では、Azure Stack HCI における GPU パーティション分割では、VM のライブマイグレーションはサポートされていません。ただし、エラーが発生した場合、VM を自動的に再起動して GPU リソースを使用できる場所に配置できます。

GPU は、Windows Admin Center または PowerShell を使用してパーティション分割することができます。 Windows Admin Center を使用し、GPU パーティションを構成して割り当てることをお勧めします。 Windows Admin Center では、クラスター内のすべてのサーバーで GPU の同種の構成が自動的に検証されます。必要な修正アクションを実行するため、適切な警告とエラーが表示されます。
PowerShell を使用して GPU パーティション分割をプロビジョニングする場合、クラスター内の各サーバーでプロビジョニング手順を実行する必要があります。クラスター内のすべてのサーバーで GPU に対して同種の構成が維持されるよう手動で確認する必要があります。

GPU パーティションが割り当てられた仮想マシンをライブマイグレーションすると、Hyper-V ライブマイグレーションは、TCP/IP (圧縮が有効) を使用するよう自動的にフォールバックされます。これにより、ホストの CPU 使用率が上昇する可能性があります。加えて、ライブマイグレーションには、GPU パーティションがアタッチされていない仮想マシンより時間がかかる場合があります。

VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。

GPU パーティション分割

GPU パーティション分割を使用するタイミング

サポートされているゲスト オペレーティング システム

サポートされている GPU

制限事項

関連するコンテンツ

その他のリソース

サポートされているゲストオペレーティングシステム