Verwalten und Erhöhen der Kontingente für Ressourcen mit Azure Machine Learning

In Azure werden Grenzwerte und Kontingente verwendet, um Budgetüberschreitungen aufgrund von Betrug zu vermeiden und Azure-Kapazitätseinschränkungen durchzusetzen. Berücksichtigen Sie diese Grenzwerte bei der Skalierung für Produktionsworkloads. In diesem Artikel lernen Sie Folgendes:

  • Standardgrenzwerte für Azure-Ressourcen in Bezug auf Azure Machine Learning
  • Erstellen von Kontingenten auf Arbeitsbereichsebene
  • Anzeigen Ihrer Kontingente und Grenzwerte
  • Anfordern von Kontingenterhöhungen

Neben dem Verwalten von Kontingenten können Sie sich darüber informieren, wie Sie die Kosten für Azure Machine Learning planen und verwalten oder mehr über die Diensteinschränkungen in Azure Machine Learning erfahren.

Besondere Überlegungen

  • Bei einem Kontingent handelt es sich um ein Kreditlimit und keine Kapazitätsgarantie. Wenn Sie einen umfangreichen Kapazitätsbedarf haben, wenden Sie sich an den Azure-Support, um Ihr Kontingent zu erhöhen.

  • Ein Kontingent wird von allen Diensten Ihres Abonnements, einschließlich Azure Machine Learning, gemeinsam verwendet. Beziehen Sie beim Bestimmen der Kapazität die Nutzungsanforderungen aller Dienste mit ein.

    Azure Machine Learning Compute ist eine Ausnahme. Dieser Dienst verfügt über ein vom Kerncomputekontingent getrenntes Kontingent.

  • Die Standardgrenzwerte variieren je nach angebotenem Kategorietyp, z. B. kostenlose Testversion, nutzungsbasierte Bezahlung und VM-Serien (wie Dv2, F und G).

Standardressourcenkontingente

In diesem Abschnitt erfahren Sie mehr über die standardmäßigen und maximalen Kontingentgrenzwerte für die folgenden Ressourcen:

  • Azure Machine Learning-Ressourcen
    • Azure Machine Learning Compute
    • Verwaltete Azure Machine Learning-Onlineendpunkte
    • Azure Machine Learning-Pipelines
  • Virtuelle Computer
  • Azure Container Instances
  • Azure Storage

Wichtig

Änderungen bei Limits bleiben vorbehalten. Die neuesten Informationen finden Sie unter Diensteinschränkungen in Azure Machine Learning.

Azure Machine Learning-Ressourcen

Die folgenden Grenzwerte für Ressourcen gelten pro Arbeitsbereich.

Ressource Maximales Limit
Datasets 10 Millionen
Ausführungen 10 Millionen
Modelle 10 Millionen
Artifacts 10 Millionen

Darüber hinaus beträgt die maximale Laufzeit 30 Tage, und die maximale Anzahl von Metriken, die pro Ausführung protokolliert werden beträgt 1 Million.

Azure Machine Learning Compute

Azure Machine Learning Compute verfügt über Standardkontingentgrenzen für die Anzahl von Kernen (aufgeteilt nach VM-Serie und kumulierter Kernanzahl) und von eindeutigen Computeressourcen, die pro Region in einem Abonnement zulässig sind. Diese Kontingente sind unabhängig von dem im vorherigen Abschnitt aufgelisteten Kontingent für VM-Kerne, da dieses nur für die verwalteten Computeressourcen von Azure Machine Learning gilt.

Fordern Sie eine Erhöhung des Kontingents an, um die Grenzwerte für die Kernkontingente verschiedener VM-Serien, die Kernkontingente des gesamten Abonnements, Clusterkontingente und die Ressourcen in diesem Abschnitt anzuheben.

Verfügbare Ressourcen:

  • Dedizierte Kerne pro Region haben je nach Typ Ihres Abonnementangebots einen Standardgrenzwert von 24 bis 300. Sie können die Anzahl dedizierter Kerne pro Abonnement für jede VM-Familie erhöhen. Spezialisierte VM-Familien wie die Serien NCv2, NCv3 oder ND beginnen mit einem Standardwert von null Kernen. GPUs sind auch standardmäßig auf null Kerne festgelegt.

  • Kerne mit niedriger Priorität pro Region haben je nach Typ Ihres Abonnementangebots einen Standardgrenzwert von 100 bis 3.000. Die Anzahl der Kerne niedriger Priorität pro Abonnement kann erhöht werden. Es handelt sich bei allen VM-Familien um einen einzelnen Wert.

  • Für Cluster pro Region gilt der Standardgrenzwert 200. Dieser Grenzwert gilt für Trainingscluster, Compute-Instanzen und MIR-Endpunktbereitstellungen. (Eine Compute-Instanz wird für Kontingentszwecke als Einzelknotencluster betrachtet.) Das Kontingent für Cluster kann innerhalb eines bestimmten Abonnements bis zu einem Wert von 500 pro Region erhöht werden.

Tipp

Weitere Informationen dazu, für welche VM-Serie eine Erhöhung des Kontingents angefordert werden sollte, finden Sie unter Größen virtueller Computer in Azure. Beispielsweise beginnen VMs der GPU-VM-Serien mit einem „N“ in der Serienbezeichnung (z. B. NCv3-Serie).

In der folgenden Tabelle sind weitere Grenzwerte der Plattform angegeben. Wenden Sie sich über ein technisches Supportticket an das Produktteam von Azure Machine Learning, um eine Ausnahme anzufordern.

Ressource oder Aktion Maximales Limit
Arbeitsbereiche pro Ressourcengruppe 800
Knoten in einem einzelnen Azure Machine Learning Compute-Cluster (AmlCompute), der als nicht kommunikationsfähiger Pool eingerichtet ist (d. h., er kann keine MPI-Aufträge ausführen) 100 Knoten, aber konfigurierbar bis 65.000 Knoten
Knoten in einem einzelnen parallelen Ausführungsschritt, die in einem Azure Machine Learning Compute-Cluster (AmlCompute) ausgeführt werden 100 Knoten, aber konfigurierbar bis 65.000 Knoten, wenn Ihr Cluster wie oben beschrieben für die Skalierung eingerichtet ist
Knoten in einem einzelnen Azure Machine Learning Compute-Cluster (AmlCompute), der als nicht kommunikationsfähiger Pool eingerichtet ist 300 Knoten (konfigurierbar bis 4.000 Knoten)
Knoten in einem einzelnen Azure Machine Learning Compute-Cluster (AmlCompute), der als nicht kommunikationsfähiger Pool auf einer RDMA-fähigen VM-Familie eingerichtet ist 100 Knoten
Knoten in einem einzelnen MPI, die in einem Azure Machine Learning Compute-Cluster (AmlCompute) ausgeführt werden 100 Knoten (erweiterbar auf 300 Knoten)
Lebensdauer von Aufträgen 21 Tage1
Lebensdauer von Aufträgen auf einem Knoten niedriger Priorität 7 Tage2
Parameterserver pro Knoten 1

1 Die maximale Lebensdauer bezieht sich auf die Zeitspanne zwischen dem Start und Ende eines Auftrags. Abgeschlossene Aufträge bleiben unbegrenzt erhalten. Daten für Aufträge, die nicht innerhalb der maximalen Lebensdauer abgeschlossen wurden, sind nicht verfügbar.

2 Aufträge auf einem Knoten niedriger Priorität können vorzeitig entfernt werden, wenn eine Kapazitätseinschränkung besteht. Wir empfehlen Ihnen, in Ihrem Auftrag Prüfpunkte zu implementieren.

Verwaltete Azure Machine Learning-Onlineendpunkte

Verwaltete Azure Machine Learning-Onlineendpunkte haben die in der folgenden Tabelle beschriebenen Grenzwerte.

Ressource Begrenzung
Endpunktname Für Endpunktnamen gilt Folgendes:
  • Sie müssen mit einem Buchstaben beginnen.
  • Sie müssen zwischen 3 und 32 Zeichen lang sein.
  • Sie dürfen nur aus Buchstaben und Ziffern bestehen.1
  • „Deployment name“ (Bereitstellungsname) Für Bereitstellungsnamen gilt Folgendes:
  • Sie müssen mit einem Buchstaben beginnen.
  • Sie müssen zwischen 3 und 32 Zeichen lang sein.
  • Sie dürfen nur aus Buchstaben und Ziffern bestehen.1
  • Anzahl privater Endpunkte pro Abonnement 50
    Anzahl von Bereitstellungen pro Abonnement 200
    Anzahl von Bereitstellungen pro Endpunkt 20
    Anzahl von Instanzen pro Bereitstellung 20 2
    Maximales Anforderungstimeout auf Endpunktebene 90 Sekunden
    Gesamtanforderungen pro Sekunde auf Endpunktebene für alle Bereitstellungen 500 3
    Gesamtanzahl der Verbindungen pro Sekunde auf Endpunktebene für alle Bereitstellungen 500 3
    Gesamtanzahl der auf Endpunktebene aktiven Verbindungen für alle Bereitstellungen 500 3
    Gesamtbandbreite auf Endpunktebene für alle Bereitstellungen 5 MBit/s 3

    1 Einzelne Bindestriche wie z .B. my-endpoint-name sind in Endpunkt- und Bereitstellungsnamen zulässig.

    2 Wir reservieren zusätzliche 20 % an Computeressourcen für die Durchführung von Upgrades. Wenn Sie beispielsweise 10 Instanzen in einer Bereitstellung anfordern, müssen Sie über ein Kontingent für 12 verfügen. Andernfalls erhalten Sie eine Fehlermeldung.

    3 Wenn Sie eine Erhöhung des Grenzwerts anfordern, sollten Sie die damit verbundenen Erhöhungen des Grenzwerts berechnen, die Sie benötigen könnten. Wenn Sie beispielsweise eine Erhöhung des Grenzwerts für Anforderungen pro Sekunde anfordern, sollten Sie auch die erforderlichen Verbindungen und Bandbreitenbegrenzungen berechnen und diese Grenzwerterhöhungen in dieselbe Anforderung einschließen.

    Zeigen Sie die Metriken an, um den aktuellen Verbrauch eines Endpunkt zu bestimmen.

    Um eine Ausnahme beim Azure Machine Learning-Produktteam zu beantragen, befolgen Sie die Schritte im Abschnitt Beantragen von Kontingenterhöhungen.

    Azure Machine Learning-Pipelines

    Für Azure Machine Learning-Pipelines gelten die unten angegebenen Grenzwerte.

    Ressource Begrenzung
    Schritte in einer Pipeline 30.000
    Arbeitsbereiche pro Ressourcengruppe 800

    Azure Machine Learning-Integration in Synapse

    Synapse Spark-Cluster weisen je nach Abonnementangebotstyp ein Standardlimit von 12–2000 auf. Dieses Limit kann erhöht werden, indem Sie ein Supportticket übermitteln und eine Anforderung zur Erhöhung des Kontingents unter der Kategorie „Machine Learning Service: Spark vCore-Kontingent“ beantragen.

    Screenshot: Formular zur Erhöhung des Kontingents mit ausgewählter Kategorie „Spark vCore-Kontingent“

    Virtuelle Computer

    Jedes Azure-Abonnement verfügt über einen Grenzwert für die Anzahl virtueller Computer für alle Dienste. Für die Kerne virtueller Computer gilt ein regionaler Gesamtgrenzwert und ein regionaler Grenzwert pro Größenserie. Beide Grenzwerte werden separat erzwungen.

    Angenommen, Sie verwenden ein Abonnement mit einem Kerngesamtgrenzwert von 30 für VMs in der Region „USA, Osten“, einem Kerngrenzwert von 30 für die A-Serie und einem Kerngrenzwert von 30 für die D-Serie. Für dieses Abonnement dürfen dann 30 virtuelle A1-Computer bzw. 30 virtuelle D1-Computer bereitgestellt werden, oder eine Kombination der beiden, bei der die Gesamtzahl von 30 Kernen nicht überschritten wird.

    Sie können Grenzwerte für virtuelle Computer nicht über die in der folgenden Tabelle angegebenen Werte hinaus erhöhen.

    Resource Begrenzung
    Einem Azure Active Directory-Mandanten zugeordnete Abonnements Unbegrenzt
    Co-Admins pro Abonnement Unbegrenzt
    Ressourcengruppen pro Abonnement 980
    Anforderungsgröße für Azure Resource Manager-API 4.194.304 Bytes
    Tags pro Abonnement1 50
    Eindeutige Tag-Berechnungen pro Abonnement2 80.000
    Bereitstellungen auf Abonnementebene pro Standort 8003
    Speicherorte von Bereitstellungen auf Abonnementebene 10

    1 Sie können bis zu 50 Tags direkt auf ein Abonnement anwenden. Das Abonnement kann jedoch eine unbegrenzte Anzahl von Tags enthalten, die auf Ressourcengruppen und Ressourcen innerhalb des Abonnements angewendet werden. Die Anzahl von Tags pro Ressource oder Ressourcengruppe ist auf 50 beschränkt.

    2Resource Manager gibt nur eine Liste mit Tagnamen und Werten im Abonnement zurück, wenn die Anzahl der eindeutigen Tags maximal 80.000 beträgt. Ein eindeutiges Tag wird durch die Kombination von Ressourcen-ID, Tagname und Tagwert definiert. Zwei Ressourcen mit demselben Tagnamen und Wert würden z. B. als zwei eindeutige Tags berechnet. Sie können eine Ressource jedoch auch anhand des Tags finden, wenn die Anzahl 80.000 überschreitet.

    3Bereitstellungen werden automatisch aus dem Verlauf gelöscht, wenn Sie den Grenzwert fast erreicht haben. Weitere Informationen finden Sie unter Automatische Löschungen aus dem Bereitstellungsverlauf.

    Container Instances

    Weitere Informationen finden Sie unter Grenzwerte für Container Instances.

    Storage

    Für Azure Storage gilt ein Grenzwert von 250 Speicherkonten pro Region und Abonnement. Dieser Grenzwert umfasst sowohl Standard- als auch Storage Premium-Konten.

    Um den Grenzwert zu erhöhen, stellen Sie eine Anforderung über den Azure-Support. Das Azure Storage-Team überprüft Ihren Fall und kann bis zu 250 Speicherkonten für eine Region genehmigen.

    Kontingente auf Arbeitsbereichsebene

    Verwenden Sie Kontingente auf Arbeitsbereichsebene zur Verwaltung der Azure Machine Learning Compute-Zielzuordnung zwischen mehreren Arbeitsbereichen in demselben Abonnement.

    Standardmäßig nutzen alle Arbeitsbereiche dasselbe Kontingent als Kontingent für VM-Familien auf Abonnementebene. Sie können jedoch ein maximales Kontingent für einzelne VM-Familien in Arbeitsbereichen in einem Abonnement festlegen. Auf diese Weise können Sie Kapazitäten freigeben und Probleme aufgrund von Ressourcenkonflikten vermeiden.

    1. Navigieren Sie zu einem beliebigen Arbeitsbereich Ihres Abonnements.
    2. Wählen Sie im linken Bereich Nutzung + Kontingente aus.
    3. Wählen Sie die Registerkarte Kontingente konfigurieren aus, um die Kontingente anzuzeigen.
    4. Erweitern Sie eine VM-Familie.
    5. Legen Sie eine Kontingentgrenze für jeden unter dieser VM-Familie aufgeführten Arbeitsbereich fest.

    Sie können keinen Wert festlegen, der negativ oder höher als das Kontingent auf Abonnementebene ist.

    Screenshot: Kontingent auf einer Azure Machine Learning-Arbeitsbereichsebene

    Hinweis

    Sie benötigen Berechtigungen auf Abonnementebene, um ein Kontingent auf Arbeitsbereichsebene festzulegen.

    Anzeigen von Kontingenten im Studio

    1. Wenn Sie eine neue Rechenressource erstellen, sehen Sie standardmäßig nur VM-Größen, für die Sie bereits ein Kontingent haben. Wechseln Sie zur Ansicht Auswahl aus allen Optionen.

      Screenshot: Auswahl aller Optionen zum Anzeigen von Computeressourcen, die ein höheres Kontingent benötigen

    2. Scrollen Sie nach unten, bis Sie die Liste der VM-Größen sehen, für die Sie kein Kontingent haben.

      Screenshot: Liste der Komponenten ohne Kontingent

    3. Benutzen Sie den Link, um direkt zum Online-Kundenservice zu gelangen und mehr Kontingente anzufordern.

    Sehen Sie Ihre Nutzung und Kontingente im Azure-Portal ein

    Um Ihr Kontingent für verschiedene Azure-Ressourcen wie virtuelle Maschinen, Speicher oder Netzwerk einzusehen, verwenden Sie das Azure-Portal:

    1. Wählen Sie im linken Bereich die Option Alle Dienste und dann unter der Kategorie Allgemein die Option Abonnements aus.

    2. Wählen Sie in der Abonnementliste das Abonnement aus, nach dessen Kontingent Sie suchen.

    3. Wählen Sie Nutzung + Kontingente aus, um Ihre derzeitigen Kontingentgrenzen und Ihre Nutzung anzuzeigen. Verwenden Sie die Filter, um den Anbieter und die Standorte auszuwählen.

    Sie verwalten das Azure Machine Learning Compute-Kontingent für Ihr Abonnement getrennt von anderen Azure-Kontingenten:

    1. Navigieren Sie im Azure-Portal zu Ihrem Azure Machine Learning-Arbeitsbereich.

    2. Wählen Sie im linken Bereich im Abschnitt Support + Problembehandlung die Option Nutzung + Kontingente aus, um Ihre aktuellen Kontingentgrenzen und die Nutzung anzuzeigen.

    3. Wählen Sie ein Abonnement aus, um die Kontingentgrenzen anzuzeigen. Filtern Sie nach der Region, an der Sie interessiert sind.

    4. Sie können zwischen der Ansicht für die Abonnementebene und der Ansicht für die Arbeitsbereichsebene umschalten.

    Anfordern der Kontingenterhöhung

    Wenn Sie einen Grenzwert oder das VM-Kontingent über den Standardgrenzwert anheben möchten, können Sie eine gebührenfreie Online-Kundensupportanfrage öffnen.

    Sie können keine Grenzwerte angeben, die über die Höchstwerte in den obigen Tabellen hinausgehen. Falls kein maximaler Grenzwert angegeben ist, können Sie den Grenzwert für die Ressource nicht anpassen.

    Wählen Sie beim Anfordern einer Kontingenterhöhung den gewünschten Dienst aus. Wählen Sie beispielsweise Machine Learning-Dienst, Container Instances oder Storage aus. Für den Azure Machine Learning-Endpunkt können Sie die Schaltfläche Kontingent anfordern auswählen, während Sie das Kontingent in den vorherigen Schritten anzeigen.

    1. Scrollen Sie zu Machine Learning-Dienst: Quote für virtuelle Maschinen.

      Screenshot des Formulars mit den VM-Kontingentdetails.

    2. Geben Sie unter Zusätzliche Details die Anforderungsdetails mit der Anzahl zusätzlicher vCPUs an, die zum Ausführen Ihres Machine Learning-Endpunkts erforderlich sind.

      Screenshot des Formulars mit den zusätzlichen VM-Kontingentdetails.

    Hinweis

    Bei Abonnements mit einer kostenlosen Testversion sind Grenzwert- oder Kontingenterhöhungen nicht möglich. Wenn Sie über ein Abonnement mit einer kostenlosen Testversion verfügen, können Sie ein Upgrade auf ein Abonnement mit nutzungsbasierter Bezahlung durchführen. Weitere Informationen finden Sie unter Upgrade einer kostenlosen Azure-Testversion auf nutzungsbasierte Bezahlung und FAQ zum kostenlosen Azure-Konto.

    Erhöhungen des Endpunktkontingents

    Geben Sie beim Beantragen der Kontingenterhöhung die folgenden Informationen an:

    1. Wählen Sie beim Öffnen der Supportanfrage Machine Learning Service: Endpunktgrenzwerte als Kontingenttyp aus.

    2. Wählen Sie auf der Registerkarte Zusätzliche Details die Option Details eingeben aus. Geben Sie dann das Kontingent an, das Sie erhöhen möchten, sowie den neuen Wert, den Grund für das Beantragen der Kontingenterhöhung und die Standorte, an denen Sie die Kontingenterhöhung benötigen. Wählen Sie abschließend Speichern und weiter aus, und fahren Sie fort.

      Screenshot des Formulars mit den Endpunkt-Kontingentdetails.

    Nächste Schritte