Udostępnij za pośrednictwem


Rozszerzenie sterownika InfiniBand dla systemu Linux

Uwaga

W tym artykule odwołuje się do systemu CentOS — dystrybucji systemu Linux, która jest stanem End Of Life (EOL). Rozważ odpowiednie użycie i zaplanuj. Aby uzyskać więcej informacji, zobacz wskazówki dotyczące zakończenia życia systemu CentOS.

To rozszerzenie instaluje sterowniki InfiniBand OFED na maszynach wirtualnych InfiniBand i SR-IOV z obsługą serii HB i N z systemem Linux. W zależności od rodziny maszyn wirtualnych rozszerzenie instaluje odpowiednie sterowniki dla karty sieciowej Connect-X. Nie instaluje sterowników InfiniBand ND na maszynach wirtualnych z serii HB i N z obsługą innych niż SR-IOV.

Instrukcje dotyczące ręcznej instalacji sterowników OFED są dostępne w temacie Włączanie funkcji InfiniBand na maszynach wirtualnych HPC.

Dostępne jest również rozszerzenie do instalowania sterowników InfiniBand dla maszyn wirtualnych z systemem Windows.

Wymagania wstępne

System operacyjny

To rozszerzenie obsługuje następujące dystrybucje systemu operacyjnego, w zależności od obsługi sterowników dla określonej wersji systemu operacyjnego. Aby uzyskać najnowszą listę obsługiwanych wersji systemu operacyjnego i sterowników, zobacz resources.json

Dystrybucja Wersja Sterowniki kart interfejsu sieciowego InfiniBand
Ubuntu 18.04 LTS, 20.04 LTS CX3-Pro, CX5, CX6
CentOS 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.1, 8,2 CX3-Pro, CX5, CX6
Red Hat Enterprise Linux 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.1, 8,2 CX3-Pro, CX5, CX6

Ważne

Ten dokument odwołuje się do wersji systemu Linux, która zbliża się lub znajduje się w końcu życia (EOL). Rozważ aktualizację do nowszej wersji.

Łączność z Internetem

Rozszerzenie platformy Microsoft Azure dla sterowników InfiniBand wymaga, aby docelowa maszyna wirtualna została połączona i ma dostęp do Internetu.

Schemat rozszerzenia

Poniższy kod JSON przedstawia schemat rozszerzenia.

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Właściwości

Nazwisko Wartość / przykład Typ danych
apiVersion 2015-06-15 data
wydawca Microsoft.HpcCompute string
type InfiniBandDriverLinux string
typeHandlerVersion 1.2 int

Wdrożenie

Szablon usługi Azure Resource Manager

Rozszerzenia maszyn wirtualnych platformy Azure można wdrażać za pomocą szablonów usługi Azure Resource Manager. Szablony są idealne podczas wdrażania co najmniej jednej maszyny wirtualnej wymagającej konfiguracji po wdrożeniu.

Konfiguracja JSON rozszerzenia maszyny wirtualnej może być zagnieżdżona wewnątrz zasobu maszyny wirtualnej lub umieszczona na poziomie głównym lub najwyższym szablonu JSON usługi Resource Manager. Umieszczanie konfiguracji JSON wpływa na wartość nazwy i typu zasobu. Aby uzyskać więcej informacji, zobacz Ustawianie nazwy i typu dla zasobów podrzędnych.

W poniższym przykładzie założono, że rozszerzenie jest zagnieżdżone wewnątrz zasobu maszyny wirtualnej. Podczas zagnieżdżania zasobu rozszerzenia kod JSON jest umieszczany w "resources": [] obiekcie maszyny wirtualnej.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Program PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "InfiniBandDriverLinux" `
    -ExtensionType "InfiniBandDriverLinux" `
    -TypeHandlerVersion 1.2 `
    -SettingString '{ `
	}'

Interfejs wiersza polecenia platformy Azure

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name InfiniBandDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.2

Dodawanie rozszerzenia do zestawu skalowania maszyn wirtualnych

W poniższym przykładzie zainstalowano najnowsze rozszerzenie InfiniBandDriverLinux w najnowszej wersji 1.2 na wszystkich maszynach wirtualnych obsługujących funkcję RDMA w istniejącym zestawie skalowania maszyn wirtualnych o nazwie myVMSS wdrożonym w grupie zasobów o nazwie myResourceGroup:

$VMSS = Get-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS"
Add-AzVmssExtension -VirtualMachineScaleSet $VMSS -Name "InfiniBandDriverLinux" -Publisher "Microsoft.HpcCompute" -Type "InfiniBandDriverLinux" -TypeHandlerVersion "1.2"
Update-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "MyVMSS" -VirtualMachineScaleSet $VMSS
Update-AzVmssInstance -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS" -InstanceId "*"

Rozwiązywanie problemów i pomoc techniczna

Rozwiązywanie problemów

Dane dotyczące stanu wdrożeń rozszerzeń można pobrać z witryny Azure Portal i przy użyciu programu Azure PowerShell i interfejsu wiersza polecenia platformy Azure. Aby wyświetlić stan wdrożenia rozszerzeń dla danej maszyny wirtualnej, uruchom następujące polecenie.

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Dane wyjściowe wykonywania rozszerzenia są rejestrowane w następującym pliku. Zapoznaj się z tym plikiem, aby śledzić stan instalacji, a także rozwiązać problemy z błędami.

/var/log/azure/ib-vmext-status

Kody zakończenia

W poniższej tabeli opisano znaczenie i zalecaną akcję na podstawie kodów zakończenia procesu instalacji rozszerzenia.

Kod zakończenia Znaczenie Możliwe działanie
0 Operacja powiodła się
1 Nieprawidłowe użycie rozszerzenia Sprawdzanie dziennika danych wyjściowych wykonywania
10 Usługi integracji z systemem Linux dla funkcji Hyper-V i platformy Azure są niedostępne lub zainstalowane Sprawdzanie danych wyjściowych biblioteki lspci
11 Nie można odnaleźć aplikacji Mellanox InfiniBand na tym rozmiarze maszyny wirtualnej Używanie obsługiwanego rozmiaru maszyny wirtualnej i systemu operacyjnego
12 Oferta obrazu nie jest obsługiwana
13 Rozmiar maszyny wirtualnej nie jest obsługiwany Wdrażanie maszyny wirtualnej serii N serii H i Nz włączoną obsługą technologii InfiniBand ("rozmiar r")
14 Operacja nie powiodła się Sprawdzanie dziennika danych wyjściowych wykonywania

Pomoc techniczna

Jeśli potrzebujesz więcej pomocy w dowolnym momencie tego artykułu, możesz skontaktować się z ekspertami platformy Azure na forach MSDN Azure i Stack Overflow. Alternatywnie możesz zgłosić zdarzenie pomocy technicznej za pośrednictwem witryny pomoc techniczna platformy Azure. Aby uzyskać informacje na temat korzystania z pomocy technicznej platformy Azure, zapoznaj się z często zadawanymi pytaniami dotyczącymi usługi Microsoft pomoc techniczna platformy Azure.

Następne kroki

Aby uzyskać więcej informacji na temat maszyn wirtualnych z obsługą technologii InfiniBand ('r'), zobacz Maszyny wirtualne serii HB i N.