Verwenden von VMs mit niedriger Priorität für Batchbereitstellungen

2024-09-03

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

Azure Batch-Bereitstellungen unterstützen VMs mit niedriger Priorität, um die Kosten für Batchrückschlussworkloads zu verringern. VMs mit niedriger Priorität ermöglichen die Nutzung einer hohen Computeleistung zu geringen Kosten. VMs mit niedriger Priorität nutzen überschüssige Kapazitäten in Azure. Wenn Sie VMs mit niedriger Priorität in Pools angeben, kann Azure diesen Überschuss nutzen, sobald er zur Verfügung steht.

Tipp

Die Verwendung von VMs mit niedriger Priorität hat jedoch den Nachteil, dass diese VMs je nach verfügbarer Kapazität möglicherweise nicht zur Verfügung stehen und jederzeit vorzeitig entfernt werden können. Aus diesem Grund eignet sich dieser Ansatz am besten für Workloads für die Batchverarbeitung und asynchrone Verarbeitung, bei denen die Zeit für den Auftragsabschluss flexibel ist und die Arbeit auf viele VMs verteilt wird.

VMs mit niedriger Priorität sind im Vergleich zu dedizierten VMs kostengünstiger. Preisdetails finden Sie unter Azure Machine Learning – Preise.

Funktionsweise der Batchbereitstellung mit VMs mit niedriger Priorität

Azure Machine Learning-Batch-Bereitstellungen stellt verschiedene Funktionen bereit, die die vorteilhafte Nutzung von VMs mit niedriger Priorität erleichtern:

Batchbereitstellungsaufträge nutzen VMs mit niedriger Priorität, da sie auf Azure Machine Learning-Computeclustern ausgeführt werden, die mit VMs mit niedriger Priorität erstellt wurden. Nachdem eine Bereitstellung einem Cluster von VMs mit niedriger Priorität zugeordnet wurde, verwenden alle von dieser Bereitstellung erstellten Aufträge VMs mit niedriger Priorität. Die Konfiguration pro Auftrag ist nicht möglich.
Batchbereitstellungsaufträge suchen automatisch die vorgegebene Anzahl der VMs im verfügbaren Computecluster basierend auf der Anzahl der zu übermittelnden Aufgaben. Wenn VMs vorgezogen wurden oder nicht verfügbar sind, versuchen Batchbereitstellungsaufträge die verlorene Kapazität zu ersetzen, indem sie die fehlgeschlagenen Aufgaben in die Warteschlange des Clusters verschieben.
VMs mit niedriger Priorität verfügen über ein separates vCPU-Kontingent, das von dem dedizierter VMs abweicht. Für Kerne mit niedriger Priorität pro Region gilt je nach Abonnement ein Standardgrenzwert von 100 bis 3.000. Die Anzahl der Kerne niedriger Priorität pro Abonnement kann erhöht werden. Es handelt sich bei allen VM-Familien um einen einzelnen Wert. Siehe Azure Machine Learning-Compute-Kontingente.

Überlegungen und Anwendungsfälle

Viele Batchworkloads eignen sich gut für VMs mit niedriger Priorität. Die Verwendung von VMs mit niedriger Priorität kann bei der Belegungsfreigabe von VMs zu Ausführungsverzögerungen führen. Wenn Sie hinsichtlich der Ausführungsdauer von Aufträgen flexibel sind, können Sie die potenziellen Kapazitätseinbußen ggf. tolerieren.

Wenn Sie Modelle unter Batchendpunkten bereitstellen, kann die Neuplanung auf Minibatchebene erfolgen. Dieser Ansatz bietet den Vorteil, dass sich die Belegungsfreigabe nur auf die Minibatches auswirkt, die auf dem betroffenen Knoten gerade verarbeitet werden und noch nicht abgeschlossen sind. Alle abgeschlossenen Aufträge werden beibehalten.

Begrenzungen

Nachdem eine Bereitstellung einem Cluster von VMs mit niedriger Priorität zugeordnet wurde, verwenden alle von dieser Bereitstellung erstellten Aufträge VMs mit niedriger Priorität. Die Konfiguration pro Auftrag ist nicht möglich.
Die Neuplanung erfolgt unabhängig vom Fortschritt auf Minibatchebene. Es wird keine Prüfpunktfunktion bereitgestellt.

Warnung

In Fällen, in denen der gesamte Cluster vorzeitig entfernt oder auf einem Einzelknotencluster ausgeführt wird, wird der Auftrag abgebrochen, da keine Kapazität für seine Ausführung verfügbar ist. In diesem Fall muss der Auftrag erneut übermittelt werden.

Erstellen von Batchbereitstellungen mit VMs mit niedriger Priorität

Batchbereitstellungsaufträge nutzen VMs mit niedriger Priorität, da sie auf Azure Machine Learning-Computeclustern ausgeführt werden, die mit VMs mit niedriger Priorität erstellt wurden.

Hinweis

Nachdem eine Bereitstellung einem Cluster von VMs mit niedriger Priorität zugeordnet wurde, verwenden alle von dieser Bereitstellung erstellten Aufträge VMs mit niedriger Priorität. Die Konfiguration pro Auftrag ist nicht möglich.

Folgendermaßen erstellen Sie einen Azure Machine Learning-Computecluster mit niedriger Priorität:

Azure-Befehlszeilenschnittstelle
Python

Erstellen Sie wie im folgenden Beispiel gezeigt eine YAML-Computedefinition low-pri-cluster.yml:

$schema: https://azuremlschemas.azureedge.net/latest/amlCompute.schema.json 
name: low-pri-cluster
type: amlcompute
size: STANDARD_DS3_v2
min_instances: 0
max_instances: 2
idle_time_before_scale_down: 120
tier: low_priority

Erstellen Sie das Compute-Element mithilfe des folgenden Befehls:

az ml compute create -f low-pri-cluster.yml

Um einen neuen Computecluster mit VMs mit niedriger Priorität zu erstellen, in dem die Bereitstellung erstellt werden soll, verwenden Sie das folgende Skript:

from azure.ai.ml.entities import AmlCompute

compute_name = "low-pri-cluster"
compute_cluster = AmlCompute(
   name=compute_name, 
   description="Low priority compute cluster", 
   min_instances=0, 
   max_instances=2,
   tier='LowPriority'
)

ml_client.begin_create_or_update(compute_cluster)

Nachdem Sie die neue Computeressource erstellt haben, können Sie Ihre Bereitstellung erstellen oder aktualisieren, um den neuen Cluster zu verwenden:

Azure-Befehlszeilenschnittstelle
Python

Um eine Bereitstellung unter dem neuen Computecluster zu erstellen oder zu aktualisieren, erstellen Sie eine YAML-Konfigurationsdatei endpoint.yml:

$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
endpoint_name: heart-classifier-batch
name: classifier-xgboost
description: A heart condition classifier based on XGBoost
type: model
model: azureml:heart-classifier@latest
compute: azureml:low-pri-cluster
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 2
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300

Erstellen Sie dann die Bereitstellung mit dem folgenden Befehl:

az ml batch-endpoint create -f endpoint.yml

Verwenden Sie zum Erstellen oder Aktualisieren einer Bereitstellung im neuen Computecluster das folgende Skript:

deployment = ModelBatchDeployment(
    name="classifier-xgboost",
    description="A heart condition classifier based on XGBoost",
    endpoint_name=endpoint.name,
    model=model,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
      instance_count=2,
      max_concurrency_per_instance=2,
      mini_batch_size=2,
      output_action=BatchDeploymentOutputAction.APPEND_ROW,
      output_file_name="predictions.csv",
      retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
   )
)

ml_client.batch_deployments.begin_create_or_update(deployment)

Anzeigen und Überwachen der Knotenbelegungsfreigabe

Neue Metriken stehen im Azure-Portal für VMs mit niedriger Priorität zur Überwachung von VMs mit niedriger Priorität zur Verfügung. Diese Metriken sind:

Vorzeitig entfernte Knoten
Preempted cores (Kerne mit präemptivem Multitasking)

So zeigen Sie diese Metriken im Azure-Portal an

Navigieren Sie im Azure-Portal zu Ihrem Azure Machine Learning-Arbeitsbereich.
Wählen Sie Metriken im Abschnitt Überwachung aus.
Wählen Sie die gewünschten Metriken aus der Liste Metriken aus.

Freigeben über

Verwenden von VMs mit niedriger Priorität für Batchbereitstellungen

Funktionsweise der Batchbereitstellung mit VMs mit niedriger Priorität

Überlegungen und Anwendungsfälle

Begrenzungen

Erstellen von Batchbereitstellungen mit VMs mit niedriger Priorität

Anzeigen und Überwachen der Knotenbelegungsfreigabe

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen