共用方式為


使用分割管理 GPU (預覽)

適用於:Azure Local 2311.2 及以後版本的超融合部署

本文說明如何使用 Azure Arc 所啟用的 Azure 本機虛擬機器 (VM) 分割 (GPU-P) 來管理 GPU。GPU-P 可讓您將 GPU 分割成專用的分數分割區,以與多個工作負載共用 GPU。

重要

這項功能目前為「預覽」狀態。 請參閱 Microsoft Azure 預覽版增補使用規定,以了解適用於 Azure 功能 (搶鮮版 (Beta)、預覽版,或尚未正式發行的版本) 的法律條款。

限制

使用 GPU-P 功能時,請考慮下列限制:

  • 如果您未使用同質設定,則不支援 GPU 分割。 以下是一些不受支援的設定範例:

    • 將相同系統中不同廠商的 GPU 混合在一起。

    • 使用來自相同系統中相同廠商之不同產品系列的不同 GPU 模型。

  • 您無法將實體 GPU 同時作為離散裝置指派 (DDA) 和可分割 GPU (GPU-P) 使用。 您可以將它指派為 DDA 或可分割的 GPU,但不能同時指派它。

  • 您只能將單一 GPU 分割區指派給 VM。

  • 分割區會自動指派給 VM。 您無法針對特定 VM 選擇特定的分割區。

  • Azure Local 的 GPU 分割功能支援即時遷移。 作業系統組建必須是 26100.xxxx 或更新版本。 主機和虛擬機器必須位於 NVIDIA 虛擬 GPU 軟體版本 18 和更新版本上。 如需詳細資訊,請參閱 Microsoft Azure 本機 - NVIDIA Docs

  • 您可以使用 Azure 命令列介面 (CLI) 分割 GPU。 建議您使用 Azure CLI 來設定和指派 GPU 磁碟分區。 您必須手動確保系統中所有機器的 GPU 保持同質化配置。

必要條件

  • 如需了解需求,準備您的 Azure 本機 VM,並確保 GPU 已準備好且已分區,請參閱準備 Azure 本機 GPU

在建立 Azure 本機 VM 時附加 GPU

請遵循 建立 Azure 本機虛擬機 中所述的步驟,並利用額外的硬體配置檔詳細數據,將 GPU 新增至您的建立程式。 執行下列步驟:

az stack-hci-vm create --name $vmName --resource-group $resource_group --admin-username $userName --admin-password $password --computer-name $computerName --image $imageName --location $location --authentication-type all --nics $nicName --custom-location $customLocationID --hardware-profile memory-mb="8192" processors="4" --storage-path-id $storagePathId --gpus GpuP

如需詳細資訊,請參閱 az stack-hci-vm create

建立 Azure 本機 VM 之後連結 GPU

使用下列 CLI 命令連結 GPU:

az stack-hci-vm stop --name your_VM_name --resource-group your_resource_group

您可以在 命令中指定分割區大小,如下所示。 分割區大小與在 Hyper-V 上的minPartitionVRAM中的Get-VMHostPartitionableGpu相同。 您也可以使用 命令,而不指定分割區大小,如上述範例所示。

az stack-hci-vm gpu attach --resource-group "test-rg" --custom-location "test-location" --vm-name "test-vm" --gpus GpuP

連結 GPU 磁碟分區之後,輸出會顯示完整的 VM 詳細數據。 您可以檢閱硬體設定檔 virtualMachineGPUs 區段來確認 GPU 已連結。 輸出如下所示:

"properties":{
	"hardwareProfile":{
		"virtualMachineGPUs":[
			{
				"assignmentType": "GpuP",
				"gpuName": null,
				"partitionSizeMb": 3648
			}
         ],

如需 GPU 附加命令的詳細資訊,請參閱 az stack-hci-vm gpu

卸除 GPU

使用下列 CLI 命令卸離 GPU:

az stack-hci-vm gpu detach --resource-group "test-rg" --custom-location "test-location" --vm-name "test-vm" --gpus GpuP

中斷連結 GPU 磁碟分區之後,輸出會顯示完整的 VM 詳細數據。 您可以檢閱硬體設定檔 virtualMachineGPUs來確認 GPU 已中斷連結。 輸出如下所示:

"properties":{
	"hardwareProfile":{
		"virtualMachineGPUs":[],

如需 GPU 附加命令的詳細資訊,請參閱 az stack-hci-vm gpu