Wdrażanie rozszerzenia usługi Azure Machine Learning w klastrze Kubernetes usługi AKS lub Arc
Aby umożliwić klastrowi AKS lub Arc Kubernetes uruchamianie zadań szkoleniowych lub obciążeń wnioskowania, należy najpierw wdrożyć rozszerzenie usługi Azure Machine Learning w klastrze AKS lub Arc Kubernetes. Rozszerzenie usługi Azure Machine Learning jest oparte na rozszerzeniu klastra dla usługi AKS i rozszerzenia klastra lub rozwiązania Arc Kubernetes, a jego cykl życia można łatwo zarządzać za pomocą rozszerzenia k8s interfejsu wiersza polecenia platformy Azure.
W tym artykule możesz dowiedzieć się:
- Wymagania wstępne
- Ograniczenia
- Przegląd ustawień konfiguracji rozszerzenia usługi Azure Machine Learning
- Scenariusze wdrażania rozszerzenia usługi Azure Machine Learning
- Weryfikacja wdrożenia rozszerzenia usługi Azure Machine Learning
- Przegląd składników rozszerzenia usługi Azure Machine Learning
- Zarządzanie rozszerzeniem usługi Azure Machine Learning
Wymagania wstępne
- Klaster usługi AKS uruchomiony na platformie Azure. Jeśli rozszerzenia klastra nie były wcześniej używane, musisz zarejestrować dostawcę usługi KubernetesConfiguration.
- Lub klaster Kubernetes usługi Arc jest uruchomiony. Postępuj zgodnie z instrukcjami w artykule Łączenie istniejącego klastra Kubernetes z usługą Azure Arc.
- Jeśli klaster jest klastrem usługi Azure RedHat OpenShift (ARO) lub klastrem OpenShift Container Platform (OCP), musisz spełnić inne kroki wymagań wstępnych opisane w artykule Reference for configuring Kubernetes cluster (Dokumentacja konfigurowania klastra Kubernetes).
- W celach produkcyjnych klaster Kubernetes musi mieć co najmniej 4 rdzenie wirtualne i 14 GB pamięci. Aby uzyskać więcej informacji na temat szczegółów zasobów i zaleceń dotyczących rozmiaru klastra, zobacz Zalecane planowanie zasobów.
- Klaster działający za serwerem proxy ruchu wychodzącego lub zapora wymaga dodatkowych konfiguracji sieci.
- Zainstaluj lub uaktualnij interfejs wiersza polecenia platformy Azure do wersji 2.24.0 lub nowszej.
- Zainstaluj lub uaktualnij rozszerzenie
k8s-extension
interfejsu wiersza polecenia platformy Azure do wersji 1.2.3 lub nowszej.
Ograniczenia
- Używanie jednostki usługi z usługą AKS nie jest obsługiwane przez usługę Azure Machine Learning. Klaster usługi AKS musi zamiast tego używać tożsamości zarządzanej. Obsługiwana jest zarówno tożsamość zarządzana przypisana przez system, jak i tożsamość zarządzana przypisana przez użytkownika. Aby uzyskać więcej informacji, zobacz Use a managed identity in Azure Kubernetes Service (Używanie tożsamości zarządzanej w usłudze Azure Kubernetes Service).
- Gdy używana przez klaster usługi AKS jednostka usługi jest konwertowana na użycie tożsamości zarządzanej, przed zainstalowaniem rozszerzenia należy usunąć i ponownie utworzyć wszystkie pule węzłów, zamiast ich bezpośredniej aktualizacji.
- Wyłączanie kont lokalnych dla usługi AKS nie jest obsługiwane przez usługę Azure Machine Learning. Po wdrożeniu klastra usługi AKS konta lokalne są domyślnie włączone.
- Jeśli klaster usługi AKS ma włączony zakres autoryzowanych adresów IP w celu uzyskania dostępu do serwera interfejsu API, włącz zakresy adresów IP płaszczyzny sterowania usługi Azure Machine Learning dla klastra usługi AKS. Płaszczyzna sterowania usługi Azure Machine Learning jest wdrożona we wszystkich sparowanych regionach. Bez dostępu do serwera interfejsu API zasobniki uczenia maszynowego nie mogą zostać wdrożone. Włączając zakresy adresów IP w klastrze usługi AKS, użyj zakresów adresów IP dla obu sparowanych regionów.
- Usługa Azure Machine Learning nie obsługuje dołączania między subskrypcjami klastra usługi AKS. Jeśli masz klaster usługi AKS w innej subskrypcji, musisz najpierw połączyć go z usługą Azure-Arc i określić w tej samej subskrypcji co obszar roboczy usługi Azure Machine Learning.
- Usługa Azure Machine Learning nie gwarantuje obsługi wszystkich funkcji etapu w wersji zapoznawczej w usłudze AKS. Na przykład tożsamość zasobnika Entra firmy Microsoft nie jest obsługiwana.
- Jeśli wykonano kroki z dokumentu usługi Azure Machine Learning AKS w wersji 1, aby utworzyć lub dołączyć usługę AKS jako klaster wnioskowania, użyj poniższego linku, aby wyczyścić starsze zasoby związane z usługą azureml-fe przed kontynuowaniem następnego kroku.
Przegląd ustawień konfiguracji rozszerzenia usługi Azure Machine Learning
Aby wdrożyć rozszerzenie usługi Azure Machine Learning, możesz użyć polecenia interfejsu wiersza polecenia k8s-extension create
usługi Azure Machine Learning. Interfejs wiersza polecenia k8s-extension create
umożliwia określenie zestawu ustawień konfiguracji w key=value
formacie przy użyciu polecenia --config
lub --config-protected
parametru. Poniżej znajduje się lista dostępnych ustawień konfiguracji, które mają być określone podczas wdrażania rozszerzenia usługi Azure Machine Learning.
Nazwa klucza ustawienia konfiguracji | opis | Szkolenia | Wnioskowanie | Trenowanie i wnioskowanie |
---|---|---|---|---|
enableTraining |
True lub False , wartość domyślna False . Dla wdrożenia rozszerzenia usługi Azure Machine Learning należy ustawić True wartość na potrzeby trenowania modelu usługi Machine Learning i obsługi oceniania wsadowego. |
✓ | Nie dotyczy | ✓ |
enableInference |
True lub False , wartość domyślna False . Należy ustawić wartość na True wartość dla wdrożenia rozszerzenia usługi Azure Machine Learning z obsługą wnioskowania usługi Machine Learning. |
Nie dotyczy | ✓ | ✓ |
allowInsecureConnections |
True lub False , wartość domyślna False . Można ustawić na wartość , aby True używać punktów końcowych HTTP wnioskowania na potrzeby programowania lub testowania. |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
inferenceRouterServiceType |
loadBalancer lub nodePort clusterIP . Wymagane , jeśli enableInference=True . |
Nie dotyczy | ✓ | ✓ |
internalLoadBalancerProvider |
Ta konfiguracja ma zastosowanie tylko do klastra usługi Azure Kubernetes Service(AKS). Ustaw wartość , aby azure zezwolić routerowi wnioskowania przy użyciu wewnętrznego modułu równoważenia obciążenia. |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
sslSecret |
Nazwa wpisu tajnego kubernetes w azureml przestrzeni nazw. Ta konfiguracja służy do przechowywania cert.pem (certyfikatu TLS/SSL zakodowanego za pomocą protokołu PEM) i key.pem (klucza TLS/SSL zakodowanego za pomocą protokołu PEM), które są wymagane do obsługi punktu końcowego HTTPS wnioskowania, gdy allowInsecureConnections jest ustawiona wartość False . Aby zapoznać się z przykładową definicją KODU YAML w sslSecret pliku , zobacz Konfigurowanie protokołu sslSecret. Użyj tej konfiguracji lub kombinacji ustawień konfiguracji chronionych i sslKeyPemFile chronionychsslCertPemFile . |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
sslCname |
Protokół CNAME protokołu TLS/SSL jest używany przez punkt końcowy protokołu HTTPS wnioskowania. Wymagane , jeśli allowInsecureConnections=False |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
inferenceRouterHA |
True lub False , wartość domyślna True . Domyślnie rozszerzenie usługi Azure Machine Learning wdraża trzy repliki routera wnioskowania w celu zapewnienia wysokiej dostępności, co wymaga co najmniej trzech węzłów roboczych w klastrze. Ustaw wartość na False wartość , jeśli klaster ma mniej niż trzy węzły robocze, w tym przypadku wdrożono tylko jedną usługę routera wnioskowania. |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
nodeSelector |
Domyślnie wdrożone zasoby kubernetes i obciążenia uczenia maszynowego są losowo wdrażane w co najmniej jednym węźle klastra, a zasoby daemonSet są wdrażane we wszystkich węzłach. Jeśli chcesz ograniczyć wdrożenie rozszerzenia i obciążenia trenowania/wnioskowania do określonych węzłów z etykietą key1=value1 i key2=value2 , użyj odpowiednio polecenia nodeSelector.key1=value1 nodeSelector.key2=value2 . |
Opcjonalnie | Opcjonalnie | Opcjonalnie |
installNvidiaDevicePlugin |
True lub False , wartość domyślna False . Wtyczka urządzenia NVIDIA jest wymagana w przypadku obciążeń uczenia maszynowego na sprzęcie GPU firmy NVIDIA. Domyślnie wdrożenie rozszerzenia usługi Azure Machine Learning nie instaluje wtyczki urządzenia NVIDIA, niezależnie od tego, czy klaster Kubernetes ma sprzęt procesora GPU, czy nie. Użytkownik może określić to ustawienie na True , aby je zainstalować, ale upewnij się, że spełnia wymagania wstępne. |
Opcjonalnie | Opcjonalnie | Opcjonalnie |
installPromOp |
True lub False , wartość domyślna True . Rozszerzenie azure Machine Learning wymaga operatora prometheus do zarządzania prometheus. Ustaw wartość , aby False ponownie użyć istniejącego operatora prometheus. Aby uzyskać więcej informacji o ponownym użyciu istniejącego operatora prometheus, zobacz ponowne przy użyciu operatora prometheus |
Opcjonalnie | Opcjonalnie | Opcjonalnie |
installVolcano |
True lub False , wartość domyślna True . Rozszerzenie Usługi Azure Machine Learning wymaga harmonogramu wulkanu, aby zaplanować zadanie. Ustaw wartość na False ponowne użycie istniejącego harmonogramu wulkanów. Aby uzyskać więcej informacji o ponownym użyciu istniejącego harmonogramu wulkanów, zobacz ponowne używanie harmonogramu wulkanu |
Opcjonalnie | Nie dotyczy | Opcjonalnie |
installDcgmExporter |
True lub False , wartość domyślna False . Eksporter Dcgm może uwidaczniać metryki procesora GPU dla obciążeń usługi Azure Machine Learning, które można monitorować w witrynie Azure Portal. Ustaw installDcgmExporter wartość na , aby True zainstalować dcgm-eksporter. Ale jeśli chcesz wykorzystać własny eksporter dcgm, zobacz eksporter DCGM |
Opcjonalnie | Opcjonalnie | Opcjonalnie |
Nazwa klucza chronionego ustawienia konfiguracji | opis | Szkolenia | Wnioskowanie | Trenowanie i wnioskowanie |
---|---|---|---|---|
sslCertPemFile , sslKeyPemFile |
Ścieżka do certyfikatu TLS/SSL i pliku klucza (kodowanego PEM), wymaganego do wdrożenia rozszerzenia usługi Azure Machine Learning z obsługą punktu końcowego HTTPS wnioskowania, gdy allowInsecureConnections jest ustawiona wartość False. Uwaga Plik PEM z chronionym przekazywaniem frazy nie jest obsługiwany |
Nie dotyczy | Opcjonalnie | Opcjonalnie |
Jak widać w tabeli ustawień konfiguracji, kombinacje różnych ustawień konfiguracji umożliwiają wdrażanie rozszerzenia usługi Azure Machine Learning dla różnych scenariuszy obciążeń uczenia maszynowego:
- W przypadku zadania szkoleniowego i obciążenia wnioskowania wsadowego określ
enableTraining=True
- W przypadku tylko obciążenia wnioskowania określ
enableInference=True
- W przypadku wszystkich rodzajów obciążeń uczenia maszynowego określ zarówno, jak
enableTraining=True
ienableInference=True
Jeśli planujesz wdrożyć rozszerzenie usługi Azure Machine Learning dla obciążenia wnioskowania w czasie rzeczywistym i chcesz określić enableInference=True
, zwróć uwagę na następujące ustawienia konfiguracji związane z obciążeniem wnioskowania w czasie rzeczywistym:
azureml-fe
Usługa routera jest wymagana do obsługi wnioskowania w czasie rzeczywistym i należy określićinferenceRouterServiceType
ustawienie konfiguracji dla elementuazureml-fe
.azureml-fe
można wdrożyć przy użyciu jednego z następujących elementówinferenceRouterServiceType
:- Wpisz
LoadBalancer
. Uwidaczniaazureml-fe
zewnętrznie przy użyciu modułu równoważenia obciążenia dostawcy usług w chmurze. Aby określić tę wartość, upewnij się, że klaster obsługuje aprowizowanie modułu równoważenia obciążenia. Zwróć uwagę, że większość lokalnych klastrów Kubernetes może nie obsługiwać zewnętrznego modułu równoważenia obciążenia. - Wpisz
NodePort
. Uwidaczniaazureml-fe
adres IP każdego węzła na porcie statycznym. Będzie można skontaktować się zazureml-fe
usługą , spoza klastra, żądając<NodeIP>:<NodePort>
polecenia . UżycieNodePort
umożliwia również skonfigurowanie własnego rozwiązania do równoważenia obciążenia i kończenia żądań TLS/SSL dla usługiazureml-fe
. - Wpisz
ClusterIP
. Uwidaczniaazureml-fe
wewnętrzny adres IP klastra i sprawia, że jestazureml-fe
dostępny tylko z poziomu klastra. Abyazureml-fe
obsługiwać żądania wnioskowania pochodzące poza klastrem, wymaga skonfigurowania własnego rozwiązania do równoważenia obciążenia i kończenia żądań TLS/SSL dla usługiazureml-fe
.
- Wpisz
- Aby zapewnić wysoką dostępność usługi routingu
azureml-fe
, wdrożenie rozszerzenia usługi Azure Machine Learning domyślnie tworzy trzy repliki klastrówazureml-fe
z trzema węzłami lub więcej. Jeśli klaster ma mniej niż 3 węzły, ustaw wartośćinferenceRouterHA=False
. - Należy również rozważyć użycie protokołu HTTPS w celu ograniczenia dostępu do punktów końcowych modelu i zabezpieczenia przesyłanych danych. W tym celu należy określić
sslSecret
ustawienie konfiguracji lub kombinację ustawień chronionychsslKeyPemFile
konfiguracją isslCertPemFile
. - Domyślnie wdrożenie rozszerzenia usługi Azure Machine Learning oczekuje ustawień konfiguracji dla obsługi protokołu HTTPS . W celach programistycznych lub testowych obsługa protokołu HTTP jest wygodnie dostarczana za pomocą ustawienia
allowInsecureConnections=True
konfiguracji .
Wdrażanie rozszerzenia usługi Azure Machine Learning — przykłady dla interfejsu wiersza polecenia i witryny Azure Portal
Aby wdrożyć rozszerzenie usługi Azure Machine Learning za pomocą interfejsu wiersza polecenia, użyj az k8s-extension create
polecenia przekazującego wartości obowiązkowych parametrów.
Do celów referencyjnych wymieniono cztery typowe scenariusze wdrażania rozszerzeń. Aby wdrożyć rozszerzenie dla użycia produkcyjnego , dokładnie przeczytaj pełną listę ustawień konfiguracji.
Użyj klastra usługi AKS na platformie Azure, aby szybko sprawdzić koncepcję, aby uruchomić wszelkiego rodzaju obciążenia uczenia maszynowego, tj. uruchamiać zadania trenowania lub wdrażać modele jako punkty końcowe online/wsadowe
W przypadku wdrożenia rozszerzenia usługi Azure Machine Learning w klastrze usługi AKS upewnij się, że określono
managedClusters
wartość parametru--cluster-type
. Uruchom następujące polecenie interfejsu wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie usługi Azure Machine Learning:az k8s-extension create --name <extension-name> --extension-type Microsoft.AzureML.Kubernetes --config enableTraining=True enableInference=True inferenceRouterServiceType=LoadBalancer allowInsecureConnections=True InferenceRouterHA=False --cluster-type managedClusters --cluster-name <your-AKS-cluster-name> --resource-group <your-RG-name> --scope cluster
Użyj klastra Arc Kubernetes spoza platformy Azure, aby szybko sprawdzić koncepcję, aby uruchamiać tylko zadania szkoleniowe
W przypadku wdrożenia rozszerzenia usługi Azure Machine Learning w klastrze Kubernetes usługi Arc należy określić
connectedClusters
wartość parametru--cluster-type
. Uruchom następujące polecenie interfejsu wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie usługi Azure Machine Learning:az k8s-extension create --name <extension-name> --extension-type Microsoft.AzureML.Kubernetes --config enableTraining=True --cluster-type connectedClusters --cluster-name <your-connected-cluster-name> --resource-group <your-RG-name> --scope cluster
Włącz klaster usługi AKS na platformie Azure na potrzeby trenowania produkcyjnego i obciążenia wnioskowania Dla wdrożenia rozszerzenia usługi Azure Machine Learning w usłudze AKS, upewnij się, że określono
managedClusters
wartość parametru--cluster-type
. Zakładając, że klaster ma więcej niż trzy węzły i używasz publicznego modułu równoważenia obciążenia platformy Azure i protokołu HTTPS do obsługi obciążeń wnioskowania. Uruchom następujące polecenie interfejsu wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie usługi Azure Machine Learning:az k8s-extension create --name <extension-name> --extension-type Microsoft.AzureML.Kubernetes --config enableTraining=True enableInference=True inferenceRouterServiceType=LoadBalancer sslCname=<ssl cname> --config-protected sslCertPemFile=<file-path-to-cert-PEM> sslKeyPemFile=<file-path-to-cert-KEY> --cluster-type managedClusters --cluster-name <your-AKS-cluster-name> --resource-group <your-RG-name> --scope cluster
Włączanie klastra Kubernetes usługi Arc w dowolnym miejscu na potrzeby trenowania produkcyjnego i wnioskowania obciążenia przy użyciu procesorów GPU FIRMY NVIDIA
W przypadku wdrożenia rozszerzenia usługi Azure Machine Learning w klastrze Kubernetes usługi Arc upewnij się, że określono
connectedClusters
wartość parametru--cluster-type
. Zakładając, że klaster ma więcej niż trzy węzły, użyj typu usługi NodePort i protokołu HTTPS na potrzeby obsługi obciążenia wnioskowania, uruchom następujące polecenie interfejsu wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie usługi Azure Machine Learning:az k8s-extension create --name <extension-name> --extension-type Microsoft.AzureML.Kubernetes --config enableTraining=True enableInference=True inferenceRouterServiceType=NodePort sslCname=<ssl cname> installNvidiaDevicePlugin=True installDcgmExporter=True --config-protected sslCertPemFile=<file-path-to-cert-PEM> sslKeyPemFile=<file-path-to-cert-KEY> --cluster-type connectedClusters --cluster-name <your-connected-cluster-name> --resource-group <your-RG-name> --scope cluster
Weryfikacja wdrożenia rozszerzenia usługi Azure Machine Learning
Uruchom następujące polecenie interfejsu wiersza polecenia, aby sprawdzić szczegóły rozszerzenia usługi Azure Machine Learning:
az k8s-extension show --name <extension-name> --cluster-type connectedClusters --cluster-name <your-connected-cluster-name> --resource-group <resource-group>
W odpowiedzi wyszukaj frazę "name" i "provisioningState": "Succeeded". Zwróć uwagę, że w ciągu pierwszych kilku minut może być wyświetlany komunikat "provisioningState": "Pending".
Jeśli stan provisioningState to Powodzenie, uruchom następujące polecenie na maszynie z plikiem kubeconfig wskazującym klaster, aby sprawdzić, czy wszystkie zasobniki w przestrzeni nazw "azureml" są w stanie "Uruchomiono":
kubectl get pods -n azureml
Przegląd składnika rozszerzenia usługi Azure Machine Learning
Po zakończeniu wdrażania rozszerzenia usługi Azure Machine Learning można wyświetlić kubectl get deployments -n azureml
listę zasobów utworzonych w klastrze. Zwykle składa się z podzbioru następujących zasobów na określone ustawienia konfiguracji.
Nazwa zasobu | Typ zasobu | Szkolenia | Wnioskowanie | Trenowanie i wnioskowanie | opis | Komunikacja z chmurą |
---|---|---|---|---|---|---|
relayserver | Wdrożenie rozwiązania Kubernetes | ✓ | ✓ | ✓ | Serwer przekaźnika jest tworzony tylko dla klastra Kubernetes usługi Arc, a nie w klastrze usługi AKS. Serwer relay współpracuje z usługą Azure Relay w celu komunikowania się z usługami w chmurze. | Odbierz żądanie utworzenia zadania, wdrożenie modelu z usługi w chmurze; zsynchronizuj stan zadania z usługą w chmurze. |
brama | Wdrożenie rozwiązania Kubernetes | ✓ | ✓ | ✓ | Brama służy do komunikowania się i wysyłania danych tam i z powrotem. | Wysyłaj węzły i informacje o zasobach klastra do usług w chmurze. |
aml-operator | Wdrożenie rozwiązania Kubernetes | ✓ | Nie dotyczy | ✓ | Zarządzanie cyklem życia zadań szkoleniowych. | Wymiana tokenów z usługą tokenu w chmurze na potrzeby uwierzytelniania i autoryzacji usługi Azure Container Registry. |
metrics-controller-manager | Wdrożenie rozwiązania Kubernetes | ✓ | ✓ | ✓ | Zarządzanie konfiguracją rozwiązania Prometheus | Nie dotyczy |
{EXTENSION-NAME}-kube-state-metrics | Wdrożenie rozwiązania Kubernetes | ✓ | ✓ | ✓ | Wyeksportuj metryki związane z klastrem do rozwiązania Prometheus. | Nie dotyczy |
{EXTENSION-NAME}-prometheus-operator | Wdrożenie rozwiązania Kubernetes | Opcjonalnie | Opcjonalnie | Opcjonalnie | Podaj natywne wdrożenie rozwiązania Kubernetes i zarządzanie rozwiązaniami Prometheus oraz powiązanymi składnikami monitorowania. | Nie dotyczy |
amlarc-identity-controller | Wdrożenie rozwiązania Kubernetes | Nie dotyczy | ✓ | ✓ | Zażądaj i odnów token usługi Azure Blob/Azure Container Registry za pomocą tożsamości zarządzanej. | Wymiana tokenów z usługą tokenów w chmurze na potrzeby uwierzytelniania i autoryzacji usługi Azure Container Registry i obiektu blob platformy Azure używanego przez wdrażanie wnioskowania/modelu. |
amlarc-identity-proxy | Wdrożenie rozwiązania Kubernetes | Nie dotyczy | ✓ | ✓ | Zażądaj i odnów token usługi Azure Blob/Azure Container Registry za pomocą tożsamości zarządzanej. | Wymiana tokenów z usługą tokenów w chmurze na potrzeby uwierzytelniania i autoryzacji usługi Azure Container Registry i obiektu blob platformy Azure używanego przez wdrażanie wnioskowania/modelu. |
azureml-fe-v2 | Wdrożenie rozwiązania Kubernetes | Nie dotyczy | ✓ | ✓ | Składnik frontonu, który kieruje przychodzące żądania wnioskowania do wdrożonych usług. | Wysyłanie dzienników usługi do obiektu blob platformy Azure. |
inference-operator-controller-manager | Wdrożenie rozwiązania Kubernetes | Nie dotyczy | ✓ | ✓ | Zarządzanie cyklem życia punktów końcowych wnioskowania. | Nie dotyczy |
wstęp do wulkanu | Wdrożenie rozwiązania Kubernetes | Opcjonalnie | Nie dotyczy | Opcjonalnie | Element webhook wstępu wulkanu. | Nie dotyczy |
kontrolery wulkanów | Wdrożenie rozwiązania Kubernetes | Opcjonalnie | Nie dotyczy | Opcjonalnie | Zarządzanie cyklem życia zasobników zadań szkoleniowych usługi Azure Machine Learning. | Nie dotyczy |
volcano-scheduler | Wdrożenie rozwiązania Kubernetes | Opcjonalnie | Nie dotyczy | Opcjonalnie | Służy do planowania zadań w klastrze. | Nie dotyczy |
fluent-bit | Zestaw demonów kubernetes | ✓ | ✓ | ✓ | Zbierz dziennik systemu składników. | Przekaż dziennik systemu składników do chmury. |
{EXTENSION-NAME}-dcgm-eksporter | Zestaw demonów kubernetes | Opcjonalnie | Opcjonalnie | Opcjonalnie | Eksporter dcgm uwidacznia metryki procesora GPU dla rozwiązania Prometheus. | Nie dotyczy |
nvidia-device-plugin-daemonset | Zestaw demonów kubernetes | Opcjonalnie | Opcjonalnie | Opcjonalnie | nvidia-device-plugin-daemonset uwidacznia procesory GPU w każdym węźle klastra | Nie dotyczy |
prometheus-prometheus | Stanowy zestaw kubernetes | ✓ | ✓ | ✓ | Zbieranie i wysyłanie metryk zadań do chmury. | Wysyłaj metryki zadań, takie jak użycie procesora CPU/procesora GPU/pamięci do chmury. |
Ważne
- Zasób usługi Azure Relay znajduje się w tej samej grupie zasobów co zasób klastra Arc. Służy do komunikowania się z klastrem Kubernetes i modyfikowanie ich spowoduje przerwanie dołączonych obiektów docelowych obliczeniowych.
- Domyślnie zasoby wdrażania kubernetes są losowo wdrażane w co najmniej 1 węzłach klastra, a zasoby zestawu demonów są wdrażane we wszystkich węzłach. Jeśli chcesz ograniczyć wdrożenie rozszerzenia do określonych węzłów, użyj
nodeSelector
ustawienia konfiguracji opisanego w tabeli ustawień konfiguracji.
Uwaga
- {EXTENSION-NAME}: to nazwa rozszerzenia określona za
az k8s-extension create --name
pomocą polecenia interfejsu wiersza polecenia.
Zarządzanie rozszerzeniem usługi Azure Machine Learning
Aktualizowanie, wyświetlanie i usuwanie rozszerzenia usługi Azure Machine Learning.
- W przypadku klastra usługi AKS bez połączonej usługi Azure Arc zapoznaj się z artykułem Wdrażanie rozszerzeń klastra i zarządzanie nimi.
- W przypadku platformy Kubernetes z obsługą usługi Azure Arc zobacz Wdrażanie rozszerzeń klastra Kubernetes z obsługą usługi Azure Arc i zarządzanie nimi.