Teilen über


Verwalten und Erhöhen der Kontingente für Ressourcen mit Azure KI Studio

Wichtig

Einige der in diesem Artikel beschriebenen Features sind möglicherweise nur in der Vorschau verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

Das Kontingent bietet die Flexibilität, die Zuordnung von Ratenbegrenzungen für die Bereitstellungen in Ihrem Abonnement aktiv zu verwalten. Dieser Artikel führt Sie durch den Prozess der Verwaltung des Kontingents für Ihre virtuellen Azure KI Studio-Computer und Azure OpenAI-Modelle.

In Azure werden Grenzwerte und Kontingente verwendet, um Budgetüberschreitungen aufgrund von Betrug zu vermeiden und Azure-Kapazitätseinschränkungen durchzusetzen. Es ist auch eine gute Möglichkeit, Kosten für Administratoren zu steuern. Berücksichtigen Sie diese Grenzwerte bei der Skalierung für Produktionsworkloads.

In diesem Artikel lernen Sie Folgendes:

  • Standardgrenzwerte für Azure-Ressourcen
  • Erstellen von Azure KI Studio-Kontingenten auf Hubebene.
  • Anzeigen Ihrer Kontingente und Grenzwerte
  • Anfordern von Kontingent- und Grenzwerterhöhungen

Besondere Überlegungen

Kontingente werden auf jedes Abonnement in Ihrem Konto angewendet. Wenn Sie über mehrere Abonnements verfügen, müssen Sie eine Kontingenterhöhung für jedes Abonnement anfordern.

Ein Kontingent ist eine Guthabengrenze für Azure-Ressourcen, keine Kapazitätsgarantie. Wenn Sie einen umfangreichen Kapazitätsbedarf haben, wenden Sie sich an den Azure-Support, um Ihr Kontingent zu erhöhen.

Hinweis

Azure KI Studio Compute verfügt über ein vom Kerncomputekontingent getrenntes Kontingent.

Die Standardgrenzwerte variieren je nach angebotenem Kategorietyp, z. B. kostenlose Testversion, nutzungsbasierte Bezahlung und VM-Serien (wie Dv2, F und G).

Azure KI Studio-Kontingent

Die folgenden Aktionen in Azure KI Studio verbrauchen Kontingent:

  • Erstellen einer Compute-Instanz.
  • Erstellen eines Vektorindexes.
  • Bereitstellen offener Modelle aus dem Modellkatalog.

Azure KI Studio Compute

Azure KI Studio Compute verfügt über eine Standardkontingentgrenze für die Anzahl von Kernen und eindeutigen Computeressourcen, die pro Region in einem Abonnement zulässig sind.

  • Das Kontingent für die Anzahl der Kerne wird auf jede VM-Familie und die kumulative Gesamtzahl der Kerne aufgeteilt.
  • Das Kontingent für die Anzahl der eindeutigen Computeressourcen pro Region ist vom VM-Kernkontingent getrennt, da es nur für die verwalteten Computeressourcen gilt

Um die Grenzwerte für Compute zu erhöhen, können Sie im Azure KI Studio eine Kontingenterhöhung anfordern.

Zu den verfügbaren Ressourcen gehören:

  • Dedizierte Kerne pro Region haben je nach Typ Ihres Abonnementangebots einen Standardgrenzwert von 24 bis 300. Sie können die Anzahl dedizierter Kerne pro Abonnement für jede VM-Familie erhöhen. Spezialisierte VM-Familien wie die Serien NCv2, NCv3 oder ND beginnen mit einem Standardwert von null Kernen. GPUs sind auch standardmäßig auf null Kerne festgelegt.
  • Für Computelimit gesamt pro Region gilt innerhalb eines bestimmten Abonnements ein Standardgrenzwert von 500 pro Region, der auf einen Maximalwert von 2.500 pro Region erhöht werden kann. Dieser Grenzwert gilt für Compute-Instanzen und verwaltete Onlineendpunktbereitstellungen. Eine Compute-Instanz wird in Bezug auf Kontingente als Cluster mit nur einem Knoten angesehen. Wenn Sie den Grenzwert erhöhen möchten, erstellen Sie eine Online-Kundensupportanfrage.

Geben Sie beim Öffnen der Supportanfrage zum Erhöhen des Berechnungslimits die folgenden Informationen an:

  1. Wählen Sie unter Problemtyp die Option Technisch aus.

  2. Wählen Sie das Abonnement aus, für das Sie das Kontingent erhöhen möchten.

  3. Wählen Sie als Diensttyp die Option Machine Learning aus.

  4. Wählen Sie die Ressource aus, für die Sie das Kontingent erhöhen möchten.

  5. Geben Sie im Feld Zusammenfassung „Compute-Grenzwerte insgesamt erhöhen“ ein

  6. Wählen Sie Computeinstanz als Problemtyp und Kontingent als Problemuntertyp aus.

    Screenshot: Seite zum Übermitteln von Computekontingentanforderungen im Azure-Portal.

  7. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Zusätzliche Details die Abonnement-ID, die Region, den neuen Grenzwert (zwischen 500 und 2.500) und eine geschäftliche Begründung an, um die Grenzwerte für das Computelimit in der Region zu erhöhen.

  9. Wählen Sie Erstellen aus, um das Supportanfrage-Ticket zu übermitteln.

Freigegebenes Azure KI Studio-Kontingent

Azure KI Studio bietet einen Pool mit gemeinsam genutztem Kontingent, das verschiedenen Benutzern in verschiedenen Regionen zur gleichzeitigen Verwendung zur Verfügung steht. Abhängig von der Verfügbarkeit können Benutzer vorübergehend über den freigegebenen Pool auf das Kontingent zugreifen und das Kontingent verwenden, um Tests für einen begrenzten Zeitraum durchzuführen. Die spezifische Dauer hängt vom Anwendungsfall ab. Wenn Sie vorübergehend ein Kontingent aus dem Kontingentpool verwenden, müssen Sie kein Supportticket mehr für eine kurzfristige Kontingenterhöhung erstellen oder warten, bis Ihre Kontingentanforderung genehmigt wurde, bevor Sie mit Ihrem Workload fortfahren können.

Die Verwendung des freigegebenen Kontingentpools steht für das Testen der Rückschlüsse für Llama-2-, Phi-, Nemotron-, Mistral-, Dolly- und Deci-DeciLM-Modelle aus dem Modellkatalog zur Verfügung. Sie sollten das freigegebene Kontingent nur zum Erstellen temporärer Testendpunkte und nicht für Produktionsendpunkte verwenden. Für Endpunkte in der Produktion sollten Sie ein dediziertes Kontingent anfordern. Die Abrechnung für das freigegebene Kontingent erfolgt wie die Abrechnung für dedizierte VM-Familien auf Nutzungsbasis.

Container Instances

Weitere Informationen finden Sie unter Grenzwerte für Container Instances.

Storage

Für Azure Storage gilt ein Grenzwert von 250 Speicherkonten pro Region und Abonnement. Dieser Grenzwert umfasst sowohl Standard- als auch Storage Premium-Konten.

Anzeigen und Anfordern von Kontingenten in Azure KI Studio

Verwenden Sie Kontingente, um die Computezielzuordnung zwischen mehreren Azure KI Studio-Hubs im selben Abonnement zu verwalten.

Standardmäßig nutzen alle Hubs dasselbe Kontingent als Kontingent für VM-Familien auf Abonnementebene. Sie können jedoch ein maximales Kontingent für einzelne VM-Familien festlegen, um die Kostenkontrolle und Governance für Hubs in einem Abonnement genauer zu steuern. Mit Kontingenten für einzelne VM-Familien können Sie Kapazität freigeben und Ressourcenkonflikte vermeiden.

  1. Wechseln Sie in Azure KI Studio zur Startseite, und wählen Sie Kontingent aus.

  2. Wählen Sie die Registerkarte Azure ML aus, um das Kontingent für die VM-Familien anzuzeigen. Das Kontingent wird auf Abonnementebene in der ausgewählten Azure-Region angezeigt. Um ein weiteres Kontingent anzufordern, wählen Sie die VM-Familie und dann Kontingent anfordern aus.

    Screenshot: Seite zum Anzeigen und Anfordern eines Kontingents für VM-Familien in Azure KI Studio.

Nächste Schritte