Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Hinweis
Dieses Dokument bezieht sich auf das Microsoft Foundry(klassische) Portal.
🔍 Zeigen Sie die Microsoft Foundry-Dokumentation (neu) an, um mehr über das neue Portal zu erfahren.
Microsoft hat Verbesserungen für sein Angebot mit bereitgestelltem Durchsatz vorgestellt, mit dem Kundenfeedback zur Benutzerfreundlichkeit und betrieblichen Flexibilität umgesetzt wird und neue Zahlungsoptionen und Bereitstellungsszenarien angeboten werden.
Dieser Artikel richtet sich an vorhandene Benutzer des Angebots für bereitgestellten Durchsatz. Neue Kunden sollten den Onboardingleitfaden für Azure OpenAI Provisioned zu Rate ziehen.
Was hat sich geändert?
Von Bedeutung
Die Änderungen in diesem Artikel beschreiben Änderungen, die am bereitgestellten verwalteten Angebot im August und Dezember 2024 vorgenommen wurden. Diese Änderungen gelten nicht für das ältere Angebot "Provisioned Classic (PTU-C)" . Sie wirken sich nur auf das Angebot „Bereitgestellt“ (auch als „Bereitgestellt-Verwaltet“ bezeichnet) aus.
Verbesserungen der Benutzerfreundlichkeit
| Merkmal | Nutzen |
|---|---|
| Modellunabhängiges Kontingent | Ein einziger Kontingentgrenzwert, der alle Modelle/Versionen abdeckt, reduziert die Kontingentverwaltung und beschleunigt das Experimentieren mit neuen Modellen. |
| Self-Service-Kontingentanforderungen | Fordern Sie Kontingenterhöhungen ohne Einbeziehung des Vertriebsteams an – viele können automatisch genehmigt werden. |
| Standardkontingent für „Bereitgestellt-Verwaltet“ in vielen Regionen | Beginnen Sie schnell, ohne zuerst ein Kontingent anfordern zu müssen. |
| Transparente Informationen zur Verfügbarkeit der Echtzeitkapazität + Neuer Bereitstellungsfluss | Weniger Verhandlungen über die Verfügbarkeit beschleunigen die Markteinführung. |
| In Datenzonen bereitgestellte Bereitstellungen | Ermöglicht Es Ihnen, die globale Infrastruktur von Azure zu nutzen, um den Datenverkehr dynamisch an das Rechenzentrum innerhalb der von Microsoft definierten Datenzone mit der besten Verfügbarkeit für jede Anforderung weiterzuleiten. Weitere Informationen finden Sie im Artikel zu Bereitstellungstypen . |
Neues Geschäftsmodell auf Stundenbasis/Reservierung
| Merkmal | Nutzen |
|---|---|
| Option „Nicht bindend, stündliche Abrechnung“ | Die Option mit stündlicher Bezahlung ohne Bindung ermöglicht kurzfristige Bereitstellungsszenarien. Sie eignet sich ideal zum Testen neuer Modelle und zur Bewertung der Vorteile von bereitgestelltem Durchsatz. |
| Laufzeitrabatte über Azure-Reservierungen | Azure-Reservierungen bieten erhebliche Rabatte im Vergleich zum Stundensatz bei einmonatigen und einjährigen Laufzeiten und bieten flexible Anwendungsbereiche, die die Verwaltung vereinfachen und an die heutigen ressourcenbehafteten Verpflichtungen angepasst sind. |
| Standardkontingent für „Bereitgestellt-Verwaltet“ in vielen Regionen | Beginnen Sie schnell in neuen Regionen, ohne zuerst ein Kontingent anfordern zu müssen. |
| Flexible Auswahl des Zahlungsmodells für bestehende bereitgestellte Kunden | Kunden mit Verpflichtungen können das Verpflichtungsmodell bis zum Lebensende der derzeit unterstützten Modelle beibehalten und vorhandene Verpflichtungen über einen verwalteten Prozess auf stündliche Zahlungen oder Reservierungen migrieren. Es wird empfohlen, zur stundenweisen Bezahlung bzw. zu Reservierungen zu migrieren, um Laufzeitrabatte nutzen und die neuesten Modellen einsetzen zu können. |
| Unterstützt die neuesten Modellgenerationen | Die aktuellen Modelle stehen nur bei stundenweiser Bezahlung/Reservierung im Angebot „Bereitgestellt“ zur Verfügung. |
| Differenzierte Preise | Mehr Flexibilität und Kontrolle über Preise und Leistung. Im Dezember 2024 haben wir differenzierte Stundenpreise für globale Bereitstellungen, Datenzonenbereitstellungen und regionale Bereitstellungstypen eingeführt, mit der Möglichkeit, Azure Reservations zu erwerben, um zusätzliche Rabatte zu unterstützen. Weitere Informationen zum Stundenpreis für jeden bereitgestellten Bereitstellungstyp finden Sie auf der Seite mit den Preisdetails . |
Details zur Verbesserung der Benutzerfreundlichkeit
Die bereitgestellte Kontingent-Granularität wurde von modellspezifisch in modellunabhängig geändert. Anstatt dass jedes Modell und jede Version innerhalb des Abonnements und der Region einen eigenen Kontingentgrenzwert hat, gibt es ein einzelnes Kontingentelement pro Abonnement und Region, das die Gesamtzahl der PTUs begrenzt, die für alle unterstützten Modelle und Versionen bereitgestellt werden können.
Modellunabhängiges Kontingent
Seit dem 12. August 2024 wurden die modellspezifischen Kontingente der bestehenden Kunden in modellunabhängig umgewandelt. Dies ist automatisch geschehen. Im Übergang wurde kein Kontingent verloren. Vorhandene Kontingentgrenzwerte wurden addiert und einem neuen modellunabhängigen Kontingentelement zugewiesen.
Das neue modellunabhängige Kontingent wird als Kontingentelement mit dem Namen Bereitgestellte verwaltete Durchsatzeinheit angezeigt, wobei Modell und Version nicht mehr im Namen enthalten sind. Im Bereich „Kontingent“ von Microsoft Foundry werden beim Erweitern des Kontingentelements weiterhin alle Bereitstellungen angezeigt, die zum Kontingentelement beitragen.
Standardkontingent
Neuen und vorhandenen Abonnements wird in vielen Regionen eine kleine Menge an bereitgestelltem Kontingent zugewiesen. Auf diese Weise können Kunden mit der Nutzung dieser Regionen beginnen, ohne zuerst ein Kontingent anfordern zu müssen.
Für bestehende Kunden gilt: Wenn die Region bereits eine Kontingentzuweisung enthält, wird der Kontingentgrenzwert für die Region nicht geändert. Beispielsweise wird er nicht automatisch um den neuen Standardwert erhöht.
Self-Service-Kontingentanforderungen
Kunden erhalten über ihre Vertriebsteams kein Kontingent mehr. Stattdessen verwenden sie das Self-Service-Kontingentanforderungsformular und geben den Kontingenttyp „PTU-Verwaltetet“ an. Auf das Formular kann über einen Link rechts neben dem Kontingentelement zugegriffen werden. Ziel ist es, innerhalb von zwei Werktagen auf alle Kontingentanforderungen zu reagieren.
Der folgende Screenshot zeigt ein modellunabhängiges Kontingent, das von Bereitstellungen unterschiedlicher Typen verwendet wird, sowie den Link zum Anfordern zusätzlicher Kontingente.
Kontingent als ein Grenzwert
Vor dem August-Update war Azure OpenAI Provisioned nur für wenige Kunden verfügbar, und das Kontingent wurde so zugewiesen, um die Möglichkeiten für die Bereitstellung und Nutzung für diese Kunden zu maximieren. Mit diesen Änderungen wird der Prozess zur Erwerbung von Kontingenten für alle Benutzer vereinfacht, und es besteht eine höhere Wahrscheinlichkeit, bei der Bereitstellung auf Kapazitätsbeschränkungen zu stoßen. Eine neue API und Portalerfahrung sind verfügbar, um Benutzenden zu helfen, Regionen zu finden, in denen das Abonnement ein Kontingent aufweist und der Dienst über die Kapazität verfügt, Bereitstellungen eines gewünschten Modells zu unterstützen.
Außerdem wird empfohlen, dass Kunden, die Mindestabnahmen verwenden, ihre Bereitstellungen jetzt erstellen, bevor sie Mindestabnahmen erstellen oder erweitern, um diese abzudecken. Dadurch wird sichergestellt, dass die Kapazität vor der Erstellung einer Mindestabnahme verfügbar ist, und ein Überbezug der Mindestabnahme verhindert. Um dies zu unterstützen, wurde die Einschränkung entfernt, die verhinderte, dass Bereitstellungen erstellt werden, die größer waren als ihre Verpflichtungen. Dieser neue Ansatz für Kontingente, Kapazitätsverfügbarkeit und Verpflichtungen entspricht dem, was im Stunden-/Reservierungsmodell bereitgestellt wird, und der Leitfaden zur Bereitstellung vor dem Kauf einer Verpflichtung (oder einer Reservierung für das Stundenmodell) ist für beide identisch.
Weitere Informationen finden Sie unter den folgenden Links: Der Leitfaden für Reservierungen und Verpflichtungen ist der gleiche:
Neues Zahlungsmodell für stündliche Reservierungen
Hinweis
Die folgende Beschreibung der Zahlungsmodelle gilt nicht für das ältere Angebot „Provisioned Classic (PTU-C)“. Sie wirken sich nur auf das Angebot „Provisioned“ (auch als „Provisioned Managed“ bezeichnet) aus. Provisioned Classic wird weiterhin vom unveränderten Zahlungsmodell der monatlichen Verpflichtungszahlung gesteuert.
Microsoft hat ein neues Zahlungsmodell „Stündlich/Reservierung“ für Bereitstellungen vom Typ „Bereitgestellt“ eingeführt. Dies gilt zusätzlich zum aktuellen Bezahlmodell im Prepaidtarif, das bis zum Ende der Lebensdauer der derzeit unterstützten eingeschränkten Modelle laut Liste weiterhin unterstützt wird. Unter den unterstützten Modellen des Vertragszahlungsmodells finden Sie die Liste der unterstützten Modelle im Vertragszahlungsmodell. Sie haben auch die Möglichkeit, Azure Reservations zu erwerben, um zusätzliche Rabatte zu unterstützen.
Neue Azure-Reservierungen für global und in Datenzonen bereitgestellte Implementierungen
Zusätzlich zu den Updates für das Stundenzahlungsmodell wurden im Dezember 2024 neue Azure Reservations speziell für globale und datenzone bereitgestellte Bereitstellungstypen eingeführt. Bei diesen neuen Azure-Reservierungen verfügt jeder bereitgestellte Bereitstellungstyp über eine separate Azure-Reservierung, mit deren Erwerb zusätzliche Rabatte möglich sind. Zuordnung zwischen bereitgestelltem Bereitstellungstyp und zugehöriger Azure-Reservierung:
| Bereitstellungstyp „Bereitgestellt“ | SKU-Name im Code | Produktname der Azure-Reservierung |
|---|---|---|
| Global bereitgestellt | GlobalProvisionedManaged |
Global bereitgestellt-verwaltet |
| In Datenzonen bereitgestellt | DataZoneProvisionedManaged |
Bereitgestellte verwaltete Datenzone |
| Bereitgestellt | ProvisionedManaged |
Regional bereitgestellt-verwaltet |
Von Bedeutung
Azure-Reservierungen für durch Azure OpenAI bereitgestellte Angebote sind zwischen den Bereitstellungstypen nicht austauschbar. Die erworbene Azure-Reservierung muss dem bereitgestellten Bereitstellungstyp entsprechen. Wenn die erworbene Azure-Reservierung nicht mit dem bereitgestellten Bereitstellungstyp übereinstimmt, wird auf die bereitgestellte Bereitstellung standardmäßig das stündliche Zahlungsmodell angewendet, bis ein passendes Azure-Reservierungsprodukt erworben wird. Weitere Informationen finden Sie in den bereitgestellten Anleitungen zu Azure Reservations für Azure OpenAI in Foundry Models.
Zahlungsmodell „Prepaidtarif“
Eine regionale, monatliche Verpflichtung ist erforderlich, um die bereitgestellten Leistungen zu nutzen (längere Laufzeiten sind vertraglich verfügbar).
Verpflichtungen sind an Azure OpenAI-Ressourcen gebunden, was das Verschieben von Deployments über verschiedene Ressourcen hinweg erschwert.
Verpflichtungen können während ihrer Laufzeit nicht storniert oder geändert werden, nur das Hinzufügen neuer PTUs ist möglich.
Unterstützte Modelle im Verpflichtungszahlungsmodell:
Nur die in der folgenden Liste enthaltenen Azure OpenAI-Modelle werden bei vertraglichen Verpflichtungen unterstützt. Weitere Informationen zum Onboarding anderer Modelle, die nicht in der folgenden Liste enthalten sind, oder neuerer Modelle mit dem Angebot eines bereitgestellten Durchsatzes finden Sie im Azure OpenAI Provisioned-Onboarding-Leitfaden und im Azure-Reservierungsleitfaden für Azure OpenAI bereitgestellte Bereitstellungen.
| Unterstützte Modelle im Prepaidtarif | Versionen |
|---|---|
| gpt-35-turbo | 0125,1106 |
| gpt-4 | 0613, 1106-Vorschau, 0125-Preview |
| gpt-4-turbo | 09.04.2024 |
| gpt-4-32k | 0613 |
| gpt-4o | 2024-05-13, 2024-08-06 |
| gpt-4o-mini | 18.07.2024 |
Zahlungsmodell für stündliche Reservierung
Das Zahlungsmodell ist an Azure-Standards für andere Produkte ausgerichtet.
Stundenweise Nutzung wird ohne Verpflichtung unterstützt.
Rabatte für einen Monat und ein Jahr Laufzeit können als regionale Azure-Reservierungen erworben werden.
Reservierungen können flexibel mehrere Abonnements abdecken, und der Umfang kann während der Laufzeit angepasst werden.
Unterstützt alle Modelle, sowohl alte als auch neue.
Von Bedeutung
Mehr neueste Modelle sind im bereitgestellten Angebot bei stundenbasierter oder reservierungsbasierter Bezahlung verfügbar. In dieser Liste finden Sie die Verfügbarkeit. Modelle, die nicht in der obigen Liste enthalten sind, können nicht auf Azure OpenAI-Ressourcen bereitgestellt werden, für ein aktiver Prepaidtarif gilt. Um neuere Modelle bereitzustellen, müssen Sie eine der folgenden Aktionen ausführen:
- Bereitstellungen in Azure OpenAI-Ressourcen ohne Verpflichtungen erstellen.
- Migrieren Sie eine vorhandenen Ressource aus den Mindestabnahmen.
Rahmen für das Zahlungsmodell
Seit der Veröffentlichung des Zahlungsmodells „stündlich/reserviert“ sind Zahlungsoptionen flexibler, und das Modell rund um Zahlungen für vorhandene Bereitstellungen hat sich geändert. Als die einmonatigen Mindestabnahmen die einzige Möglichkeit zum Kauf waren, sah das Modell so aus:
- Ein PTU-Kontingent von Ihrem Microsoft-Kontoteam abrufen.
- Sie „kaufen“ ein Kontingent von einer Mindestabnahme für die Ressource, in der Sie bereitstellen möchten.
- Sie erstellen Bereitstellungen für die Ressource bis zum Grenzwert der Mindestabnahme.
Der Hauptunterschied zwischen diesem Modell und dem neuen Modell besteht darin, dass früher die einzige Zahlungsmethode für bereitgestellte Ressourcen in einem einmonatigen Laufzeitrabatt bestand. Jetzt können Sie Ressourcen bereitstellen und für Bereitstellungen stündlich bezahlen, wenn Sie möchten, und separat entscheiden, ob Sie sie über eine einmonatige Mindestabnahme (wie zuvor) oder eine Azure-Reservierung rabattieren möchten.
Mit diesem Einsicht ergibt sich eine neue Möglichkeit, über Zahlungsmodelle nachzudenken:
- Sie rufen ein PTU-Kontingent mithilfe des Self-Service-Formulars ab.
- Erstellen Sie Bereitstellungen unter Verwendung Ihres Kontingents.
- Optional kaufen oder verlängern Sie eine Mindestabnahme oder eine Reservierung, um einen Laufzeitrabatt auf Ihre Bereitstellungen anzuwenden.
Die Schritte 1 und 2 sind in allen Fällen identisch. Der Unterschied besteht darin, ob eine Verpflichtung oder eine Azure-Reservierung als Mittel zur Gewährung des Rabatts verwendet wird. Für beide Modelle gilt:
Es ist möglich, mehr PTUs bereitzustellen als rabattiert werden. (Beispielsweise wird eine kurzfristige Bereitstellung zum Ausprobieren eines neuen Modells ermöglicht, indem die Bereitstellung ohne Erwerb eines Rabatts erfolgt)
Bei der Rabattmethode (Bindung oder Reservierung) wird der ermäßigte Preis auf eine feste Anzahl von PTUs angewendet und hat einen Umfang, der definiert, welche Bereitstellungen gegen den Rabatt angerechnet werden.
Rabattart Verfügbare Bereiche (innerhalb einer Region) Verpflichtung Azure OpenAI-Ressource Reservierung Ressourcengruppe, Einzelabonnement, Verwaltungsgruppen (Gruppen von Abonnements), Gemeinsam genutzt (alle Abonnements in einem Abrechnungskonto) Der ermäßigte Preis wird auf bereitgestellte PTUs angewendet und zwar bis zu der im Rabatt enthaltenen Anzahl ermäßigter PTUs.
Eine Anzahl von eingesetzten PTUs, die mehr als die rabattierten PTUs ist (oder nicht durch irgendeinen Rabatt abgedeckt wird), wird mit dem Stundensatz berechnet.
Die bewährte Methode besteht darin, zuerst Bereitstellungen zu erstellen und dann Rabatte anzuwenden. Damit wird dieser Dienst gewährleistet. Es steht Kapazität zur Verfügung, um Ihre Bereitstellungen zu unterstützen, bevor Sie eine Laufzeitverpflichtung für PTUs erstellen, die Sie nicht verwenden können.
Hinweis
Wenn Sie die bewährten Methoden befolgen, können Ihnen zwischen dem Zeitpunkt der Erstellung der Bereitstellung und der Erhöhung des Rabatts (Mindestabnahme oder Reservierung) stündliche Gebühren in Rechnung gestellt werden.
Aus diesem Grund empfehlen wir, sich darauf vorzubereiten, Ihren Rabatt unmittelbar nach der Bereitstellung zu erhöhen. Für den Kauf von Azure-Reservierungen gelten andere Voraussetzungen als für Mindestabnahmen. Wir empfehlen Ihnen daher, diese vor der Bereitstellung zu überprüfen, wenn Sie die Mindestabnahmen zum Rabattieren Ihrer Bereitstellung verwenden möchten. Weitere Informationen finden Sie unter Berechtigungen zum Anzeigen und Verwalten von Azure-Reservierungen.
Zuordnen von Bereitstellungen zur Rabattmethode
Kunden, die das Angebot „Azure OpenAI Provisioned“ vor dem August 2024 verwendet haben, können beide Zahlungsmodelle gleichzeitig innerhalb eines Abonnements verwenden. Das für die jeweilige Bereitstellung verwendete Zahlungsmodell wird anhand der Azure OpenAI-Ressource bestimmt:
Ressource hat eine aktive Verpflichtung
- Die Mindestabnahme rabattiert alle Bereitstellungen für die Ressource bis zur Anzahl der PTUs in der Mindestabnahme. Alle überzähligen PTUs werden stündlich in Rechnung gestellt, es sei denn, die überzähligen PTUs liegen nicht im Umfang einer aktiven Reservierung. Wenn die überzähligen PTUs zu einer aktiven Reservierung gehören, werden sie als Gruppe bis zur Anzahl der PTUs für die Reservierung als Rabatt abgerechnet, und alle darüber hinausgehenden PTUs werden stündlich abgerechnet.
Ressource hat keine aktive Verpflichtung
- Die Bereitstellungen im Rahmen der Ressource sind für einen Rabatt durch eine Azure-Reservierung berechtigt. Damit diese Bereitstellungen rabattiert werden können, müssen sie im Rahmen einer aktiven Reservierung erfolgen. Alle Bereitstellungen im Rahmen der Reservierung (einschließlich möglicherweise Bereitstellungen in anderen Ressourcen in demselben Abonnement oder anderen Abonnements) werden als Gruppe bis zur Anzahl der PTUs in der Reservierung rabattiert. Überzählige PTUs werden pro Stunde abgerechnet.
Änderungen am vorhandenen Zahlungsmodus
Kunden, die heute Verpflichtungen haben, können sie zumindest bis zur Einstellung des unterstützten Modells weiterhin verwenden. Dazu gehört der Erwerb neuer PTUs für neue oder bestehende Verpflichtungen sowie das Management von Verpflichtungsverlängerungen. Das August-Update hat jedoch bestimmte Aspekte des Betriebs von Verpflichtungen geändert.
Azure OpenAI hat die Registrierung bei neuen Prepaidtarifen am 1. August 2024 beendet
Nur eine begrenzte Anzahl von Modellen kann auf einer Ressource mit fester Verpflichtung bereitgestellt werden. Hier ist die Liste der Modelle.
Wenn die bereitgestellten PTUs im Rahmen einer Verpflichtung die zugesagten PTUs übersteigen, werden die stündlichen Überstundengebühren auf den gleichen Stundenzähler verrechnet, der für das neue Stunden-/Reservierungszahlungsmodell verwendet wird. Dadurch können die Überschreitungsgebühren über eine Azure-Reservierung rabattiert werden.
Es ist möglich, mehr PTUs bereitzustellen, als auf der Ressource festgelegt sind. Dies unterstützt die Möglichkeit, die Verfügbarkeit von Kapazitäten zu garantieren, bevor die Verpflichtungsgröße erhöht wird, um sie abzudecken.
Migrieren vorhandener Ressourcen von Verpflichtungen weg
Bestehende Kunden können ihre vorhandenen Ressourcen vom Zahlungsmodell „Prepaidtarif“ zu „Stündlich/Reservierung“ migrieren, um von der Möglichkeit zu profitieren, die neuesten Modelle bereitzustellen, oder die Rabattierung mithilfe von Selfservice für verschiedene Bereitstellungen unter einer einzigen Reservierung zu konsolidieren.
Self-Service-Migration
Der Self-Service-Migrationsansatz ermöglicht es Kunden, Ressourcen organisch aus ihren Mindestabnahmen abzubauen, indem sie sie auslaufen lassen. Der Prozess zum Migrieren einer Ressource ist wie folgt:
Legen Sie die vorhandene Verpflichtung so fest, dass sie nicht automatisch verlängert wird, und notieren Sie sich das Ablaufdatum.
Vor dem Ablaufdatum sollte ein Kunde eine Azure-Reservierung erwerben, welche die Gesamtzahl der zugesicherten PTUs pro Abonnement abdeckt. Wenn eine bestehende Reservierung das Abonnement bereits in ihrem Umfang hat, kann sie um die neuen PTUs erweitert werden.
Wenn die Verpflichtung abläuft, werden die Bereitstellungen unter der Ressource automatisch in den Modus „Stündlich/Reservierung“ umgestellt, wobei der Verbrauch durch die Reservierung rabattiert wird.
Dieser Self-Service-Migrationsansatz führt zu einer Überschneidung, bei der sowohl die Reservierung als auch die Verpflichtung aktiv sind. Dies ist ein Merkmal dieses Migrationsmodus, und die Zeit der Reservierung oder Verpflichtung für diese Überschneidung wird dem Kunden nicht gutgeschrieben.
Ein alternativer Ansatz für die Self-Service-Migration besteht darin, den Reservierungskauf so zu wechseln, dass er nach Ablauf der Verpflichtung durchgeführt wird. Bei diesem Ansatz werden die Implementierungen stündliche Nutzung für den Zeitraum zwischen dem Ablauf der Verpflichtungsfrist und dem Kauf der Reservierung generieren. Wie bei dem vorherigen Modell ist dies ein Merkmal dieses Ansatzes, und dieser stündliche Verbrauch wird nicht gutgeschrieben.
Vorteile der Self-Service-Migration:
- Einzelne Ressourcen können zu unterschiedlichen Zeiten migriert werden.
- Kunden verwalten die Migration, ohne von Microsoft abhängig zu sein.
Nachteile der Self-Service-Migration:
- Während der Umstellung der Abrechnung von „Prepaidtarif“ auf „Stündlich/Reservierung“ gibt es einen kurzen Zeitraum mit doppelter Abrechnung oder stündlichen Gebühren.
Von Bedeutung
Der Self-Service-Ansatz generiert einige zusätzliche Gebühren, wenn der Zahlungsmodus von einem Prepaidtarif auf stundenweise Bezahlung/Reservierung umgestellt wird. Dies sind die Merkmale der Migrationsansätze – den Kunden werden diese Gebühren nicht gutgeschrieben.
Migrieren vorhandener Bereitstellungen zu Bereitstellungen vom Typ „Global bereitgestellt“ oder „In Datenzonen bereitgestellt“
Bestehende Kunden von bereitgestellten Systemen können zu globalen oder in Datenzonen bereitgestellten Systemen wechseln, um von den niedrigeren Mindestanforderungen für die Bereitstellung, feinen Skalierungsschritten oder differenzierten Preisen zu profitieren, die für diese Systemtypen verfügbar sind. Weitere Informationen zur Datenverarbeitung in Azure-Regionen bei global und in Datenzonen bereitgestellten Bereitstellungen finden Sie in der Dokumentation zur Datenverarbeitung Ihrer Azure OpenAI-Bereitstellung.
Kunden stehen zwei Ansätze zur Migration von bereitgestellten Bereitstellungen zu global oder in Datenzonen bereitgestellten Bereitstellungen zur Verfügung.
Migration ohne Downtime
Mit dem Migrationsansatz ohne Downtime können Kunden ihre vorhandenen bereitgestellten Bereitstellungen zu Bereitstellungen vom Typ „Global bereitgestellt“ oder „In Datenzonen bereitgestellt“ migrieren, ohne den vorhandenen Rückschlussdatenverkehr ihrer Bereitstellung zu unterbrechen. Bei diesem Migrationsansatz werden Workload-Unterbrechungen minimiert. Er erfordert jedoch, dass Kunden mehrere koexistierende Bereitstellungen haben, während sie den Datenverkehr verlagern. Der Prozess zur Migration einer bereitgestellten Umgebung mit dem Null-Downtime-Migrationsansatz sieht folgendermaßen aus:
- Erstellen Sie eine neue Bereitstellung mit dem Bereitstellungstyp global oder in Datenzonen bereitgestellt in der Azure OpenAI-Zielressource.
- Übertragen Sie den Datenverkehr vom vorhandenen regional bereitgestellten Bereitstellungstyp auf die neu erstellte global oder in Datenzonen bereitgestellte Bereitstellung, bis der gesamte Datenverkehr aus der regionalen Bereitstellung überführt ist.
- Nachdem der Datenverkehr zur neuen Bereitstellung migriert wurde, vergewissern Sie sich, dass keine Rückschlussanforderungen für die vorherige bereitgestellte Bereitstellung verarbeitet werden. Stellen Sie dazu sicher, dass die Metrik „Azure OpenAI-Anforderungen“ keine API-Aufrufe innerhalb von 5 bis 10 Minuten nach der Migration des Rückschlussdatenverkehrs zur neuen Bereitstellung aufweist. Weitere Informationen zu dieser Metrik finden Sie in der Dokumentation zum Überwachen von Azure OpenAI.
- Nachdem Sie sich vergewissert haben, dass keine Rückschlussaufrufe getätigt wurden, löschen Sie die regionale Bereitstellung.
Migration mit Ausfallzeiten
Die Migration mit Downtime umfasst die Migration vorhandener bereitgestellter Bereitstellungen zu Bereitstellungen vom Typ „Global bereitgestellt“ oder „In Datenzonen bereitgestellt“, während alle vorhandenen Rückschlüsse in der ursprünglichen bereitgestellten Bereitstellung beendet werden. Dieser Migrationsansatz erfordert keine parallele Existenz mehrerer Bereitstellungen zur Unterstützung, verursacht allerdings Unterbrechungen im Arbeitsablauf. Der Prozess zum Migrieren eines bereitgestellten Einsatzes unter Verwendung des Migrationsansatzes mit Unterbrechung gestaltet sich wie folgt:
- Vergewissern Sie sich, dass keine Rückschlussanforderungen für die vorherige bereitgestellte Bereitstellung verarbeitet werden. Stellen Sie dazu sicher, dass die Metrik „Azure OpenAI-Anforderungen“ keine API-Aufrufe in den letzten 5 bis 10 Minuten aufweist. Weitere Informationen zu dieser Metrik finden Sie in der Dokumentation zum Überwachen von Azure OpenAI.
- Nachdem Sie sich vergewissert haben, dass keine Rückschlussaufrufe getätigt wurden, löschen Sie die regionale Bereitstellung.
- Erstellen Sie eine neue Bereitstellung mit den Bereitstellungstypen "global" oder "Datenzone" für die Zielressource Azure OpenAI.
- Wenn die neue Bereitstellung erfolgreich war, können Sie den Rückschlussdatenverkehr in der neuen global oder in Datenzonen bereitgestellten Bereitstellung fortsetzen.
Wie migriere ich eine vorhandene Azure-Reservierung zu den neuen Azure-Reservierungsprodukten?
Azure-Reservierungen für Azure OpenAI bereitgestellte Angebote sind spezifisch für den bereitgestellten Bereitstellungstyp. Wenn die erworbene Azure-Reservierung nicht mit dem bereitgestellten Bereitstellungstyp übereinstimmt, wird auf die Bereitstellung standardmäßig das stündliche Zahlungsmodell angewendet. Wenn Sie zu global oder in Datenzonen bereitgestellten Bereitstellungen migrieren möchten, müssen Sie möglicherweise eine neue Azure-Reservierung für diese Bereitstellungen erwerben, um zusätzliche Rabatte zu erhalten. Weitere Informationen zum Kauf einer neuen Azure-Reservierung oder zum Vornehmen von Änderungen an einer vorhandenen Azure-Reservierung finden Sie in den Azure Reservations for Azure OpenAI Provisioned Guidance.
Erstellen einer Mindestabnahme für den bereitgestellten Durchsatz
Mindestabnahmen für bereitgestellten Durchsatz werden erstellt und verwaltet, indem Sie Verwaltungszentrum im Navigationsmenü des Foundry-Portals und dann >Kontingent>Mindestabnahmen verwalten auswählen.
In der Ansicht Mindestabnahme verwalten können Sie verschiedene Aktionen ausführen:
- Kaufen Sie neue Verpflichtungen oder bearbeiten Sie bestehende Verpflichtungen.
- Überwachen Sie alle Verpflichtungen in Ihrem Abonnement.
- Identifizieren und handeln bei Verpflichtungen, die zu einer unerwarteten Abrechnung führen könnten.
In den folgenden Abschnitten werden Sie durch diese Aufgaben geführt.
Erwerben einer Mindestabnahme für den bereitgestellten Durchsatz
Wenn der Mindestabnahmeplan bereit ist, besteht der nächste Schritt darin, die Mindestabnahme zu erstellen. Verpflichtungen werden manuell über die Foundry erstellt und erfordern, dass der Benutzer die Verpflichtung erstellt, entweder die Rolle "Mitwirkender" oder "Cognitive Services Contributor" auf Abonnementebene zu übernehmen.
Führen Sie für jedes neue Commitment, das Sie erstellen müssen, die folgenden Schritte aus:
- Öffnen Sie das Dialogfeld zum Erwerb von bereitgestelltem Durchsatz, indem Sie Kontingent>Azure OpenAI Bereitgestellt>Prepaidtarifpläne verwalten auswählen.
Wählen Sie Kaufverpflichtung aus.
Wählen Sie die Azure OpenAI-Ressource aus, und erwerben Sie das Commitment. Ihre Ressourcen werden in Ressourcen mit bestehenden Verpflichtungen, die Sie bearbeiten können, und Ressourcen unterteilt, für die derzeit keine Verpflichtung besteht.
| Konfiguration | Hinweise |
|---|---|
| Ressource auswählen | Wählen Sie die Ressource aus, in der Sie die bereitgestellte Bereitstellung erstellen. Nachdem Sie den Prepaidtarif erworben haben, können Sie die PTUs nicht mehr für eine andere Ressource verwenden, bis der aktuelle Prepaidtarif abläuft. |
| Typ der Mindestabnahme auswählen | Wählen Sie „Bereitgestellt“ aus. („Bereitgestellt“ ist gleichbedeutend mit „Bereitgestellt-Verwaltet“.) |
| Aktuelles bereitgestelltes Kontingent ohne Commit | Die Anzahl der PTUs, die Ihnen derzeit zur Zuweisung für diese Ressource zur Verfügung stehen. |
| Zu investierender Betrag (PTU) | Wählen Sie die Anzahl der PTUs aus, zu denen Sie sich verpflichten. Diese Anzahl kann während der Laufzeit erhöht, aber nicht verringert werden. Geben Sie Werte in Schritten von 50 für den Commitment-Typ "Provisioned" ein. |
| Commitmentstufe für den aktuellen Zeitraum | Der Commitmentzeitraum wird auf einen Monat festgelegt. |
| Verlängerungseinstellungen | Automatische Verlängerung mit aktuellen PTUs Automatische Verlängerung mit weniger PTUs Keine automatische Verlängerung |
- Wählen Sie die Option Kaufen. Ein Dialogfeld zur Bestätigung wird angezeigt. Nach Ihrer Bestätigung werden Ihre PTUs committet, und Sie können diese verwenden, um eine bereitgestellte Bereitstellung zu erstellen. |
Von Bedeutung
Eine neue Verpflichtung wird im Voraus für die gesamte Laufzeit in Rechnung gestellt. Wenn die Verlängerungseinstellungen auf automatische Verlängerung festgelegt sind, erhalten Sie basierend auf den Verlängerungseinstellungen erneut an jedem Verlängerungsdatum eine Rechnung.
Bearbeiten einer vorhandenen Mindestabnahme für den bereitgestellten Durchsatz
In der Ansicht Verpflichtungen verwalten können Sie auch eine vorhandene Verpflichtung bearbeiten. Es stehen zwei Arten von Änderungen zur Verfügung, die Sie an einer bestehenden Verpflichtung vornehmen können:
- Sie können der Mindestabnahme PTUs hinzufügen.
- Sie können die Verlängerungseinstellungen ändern.
Um eine Mindestabnahme zu bearbeiten, wählen Sie die aktuelle Mindestabnahme zur Bearbeitung aus, und wählen Sie dann „Mindestabnahme bearbeiten“ aus.
Hinzufügen von bereitgestellten Durchsatzeinheiten zu vorhandenen Mindestabnahmen
Durch das Hinzufügen von PTUs zu einer vorhandenen Mindestabnahme können Sie größere oder zahlreichere Bereitstellungen innerhalb der Ressource erstellen. Sie können dies jederzeit während der Laufzeit Ihrer Verpflichtung tun.
Von Bedeutung
Wenn Sie PTUs einem Prepaidtarif hinzufügen, werden diese sofort ab dem aktuellen Datum bis zum Ende der Laufzeit des bestehenden Prepaidtarifs zu einem anteiligen Betrag in Rechnung gestellt. Durch das Hinzufügen von PTUs wird die Verpflichtungslaufzeit nicht zurückgesetzt.
Änder der Verlängerungseinstellungen
Die Einstellungen für die Verlängerung der Verpflichtung können jederzeit vor dem Ablaufdatum Ihrer Verpflichtung geändert werden. Mögliche Gründe für die Änderung der Verlängerungseinstellungen umfassen das Beenden der Nutzung des bereitgestellten Durchsatzes, indem Sie die Verpflichtung auf Nicht-Verlängerung einstellen, oder die Verringerung der Nutzung des bereitgestellten Durchsatzes, indem Sie die Anzahl der festgelegten PTUs im nächsten Zeitraum reduzieren.
Von Bedeutung
Wenn Sie zulassen, dass eine Verpflichtung abläuft oder ihr Umfang schrumpft, sodass die Bereitstellungen unter der Ressource mehr PTUs erfordern, als Sie in Ihrer Ressourcenverpflichtung haben, fallen stündliche Überschreitungsgebühren für überschüssige PTUs an. Eine Ressource mit Bereitstellungen, die insgesamt 500 PTUs umfassen, und einer Mindestabnahme für 300 PTUs generiert stündliche Überschreitungsgebühren für 200 PTUs.
Verpflichtungen überwachen und Überraschungsabrechnungen verhindern
Der Abschnitt "Verpflichtungen verwalten" bietet einen umfassenden Überblick über alle Ressourcen mit Verpflichtungen und PTU-Nutzung innerhalb eines bestimmten Azure-Abonnements. Von besonderer Bedeutung sind:
- Verpflichtete, bereitgestellte und genutzte PTUs: Diese Zahlen geben die Größen Ihrer Verpflichtungen sowie die Menge an, die durch Bereitstellungen genutzt wird. Maximieren Sie Ihre Investition, indem Sie alle committeten PTUs verwenden.
- Ablaufrichtlinie und -datum: Das Ablaufdatum und die Ablaufrichtlinie geben an, wann eine Verpflichtung abläuft und was in diesem Fall geschieht. Eine Mindestabnahme, für die die automatische Verlängerung festgelegt ist, generiert am Verlängerungsdatum ein Abrechnungsereignis. Achten Sie bei ablaufenden Mindestabnahmen darauf, dass Sie Bereitstellungen aus diesen Ressourcen vor dem Ablaufdatum löschen, um stündliche Überschreitungsgebühren zu verhindern. Die aktuellen Verlängerungseinstellungen für eine Mindestabnahme.
- Benachrichtigungen: Warnungen zu wichtigen Bedingungen wie nicht genutzte Mindestabnahmen und Konfigurationen, die zu Abrechnungsüberschreitungen führen können. Abrechnungsüberschreitungen können etwa verursacht werden, wenn eine Mindestabnahme abgelaufen ist und noch Bereitstellungen vorhanden sind, aber auf die stündliche Abrechnung umgestellt wurde.
Von Bedeutung
Wenn Sie eine Verpflichtung zur automatischen Verlängerung festlegen, ist das Verlängerungsdatum dasselbe Datum für den nächsten Monat. Wenn das Datum nicht vorhanden ist, ist das Verlängerungsdatum das Ende des Monats.
Beispiele-
Szenario 1: Wenn Sie am 21. Februar eine Verpflichtung erwerben und die Verpflichtung für die automatische Verlängerung festlegen, wird der nächste Verlängerungstermin für die Verpflichtung am 21. März sein.
Szenario 2: Wenn Sie die Verpflichtung am 31. Mai erwerben und die Verpflichtung für die automatische Verlängerung festlegen, wird das nächste Verlängerungsdatum für die Verpflichtung 30. Juni (Ende Monat) sein, da es im Monat Juni keine 31. gibt.
Szenario 3: Wenn Sie die Verpflichtung am 31. Januar erwerben und die Verpflichtung für die automatische Verlängerung festlegen, wird das nächste Verlängerungsdatum für die Verpflichtung 28 Februar (Ende Des Monats) sein, da es keinen 31. oder 30. oder 29. (in Nicht-Schaltjahren) gibt, und das Verlängerungsdatum wäre februar 29 (in einem Schaltjahr) im Monat Februar.
Übliche Szenarien für die Verwaltung von Verpflichtungen
Beenden der Verwendung des bereitgestellten Durchsatzes
Um die Verwendung des bereitgestellten Durchsatzes zu beenden und stündliche Überschreitungsgebühren nach dem Ablauf der Mindestabnahme zu vermeiden, müssen zwei Schritte ausgeführt werden:
- Legen Sie die Verlängerungsrichtlinie für alle Commitments auf Keine automatische Verlängerung fest.
- Löschen Sie die bereitgestellten Bereitstellungen mithilfe des Kontingents.
Von Bedeutung
Wenn Sie den Ablauf eines Prepaidtarifs mit der Absicht zulassen, den bereitgestellten Durchsatz einzustellen, und Sie die bereitgestellten Bereitstellungen nicht löschen, werden Ihnen stündliche Überschreitungsgebühren für alle PTUs in Rechnung gestellt, die sich noch in der Bereitstellung befinden. Eine Ressource, die Bereitstellungen mit insgesamt 500 PTUs umfasst und bei der die Verpflichtung auf „Nicht autorenew“ gesetzt wurde, verursacht nach Ablauf der Verpflichtung stündliche Gebühren, bis die Bereitstellung gelöscht wird. Es gibt heute keine Option, die die Bereitstellung automatisch löscht, sie muss manuell gelöscht werden, wenn Sie sich entschließen, die Verwendung des bereitgestellten Durchsatzes einzustellen.
Verschieben eines Commitments/einer Bereitstellung in eine neue Ressource in demselben Abonnement/derselben Region
In Foundry ist es nicht möglich, eine Bereitstellung oder eine Verpflichtung zu einer neuen Ressource direkt zu verschieben . Stattdessen muss eine neue Bereitstellung für die Zielressource erstellt und der Datenverkehr dorthin umgeleitet werden. Um dies zu erreichen, muss ein Commitment für die neue Ressource erworben werden. Da Verpflichtungen für einen Zeitraum von 30 Tagen im Voraus in Rechnung gestellt werden, ist es notwendig, diesen Schritt mit dem Ablauf des ursprünglichen Engagements zu begehen, um die Überschneidung mit der neuen Verpflichtung und der "Doppelabrechnung" während der Überlappung zu minimieren.
Es gibt zwei Ansätze, die zur Umsetzung dieses Übergangs ergriffen werden können.
Option 1: Übergang ohne Überschneidung
Diese Option ist mit einer gewissen Ausfallzeit verbunden, erfordert jedoch kein zusätzliches Kontingent und generiert keine zusätzlichen Kosten.
| Schritte | Hinweise |
|---|---|
| Festlegen der Verlängerungsrichtlinie für den bestehenden Prepaidtarif auf Ablauf | Dadurch wird verhindert, dass das Commitment verlängert wird und weitere Gebühren generiert werden |
| Löschen der Bereitstellung vor Ablauf des vorhandenen Prepaidtarifs | Die Ausfallzeit beginnt zu diesem Zeitpunkt und dauert an, bis die neue Bereitstellung erstellt und Datenverkehr umgeleitet wurde. Sie minimieren die Dauer, indem Sie den Löschvorgang so nah am Ablaufdatum/der Ablaufzeit wie möglich festlegen. |
| Erstellen Sie nach Ablauf der bestehenden Verpflichtung eine neue Verpflichtung für die neue Ressource. | Minimieren Sie die Ausfallzeit, indem Sie diesen und den nächsten Schritt so bald wie möglich nach dem Ablauf ausführen. |
| Erstellen der Bereitstellung für die neue Ressource und Umleiten des Datenverkehrs dorthin |
Option 2: Überlappender Übergang
Diese Option hat keine Ausfallzeit, da sowohl vorhandene als auch neue Bereitstellungen gleichzeitig aktiv sind. Dies erfordert, dass das Kontingent zum Erstellen der neuen Bereitstellung verfügbar ist, und generiert zusätzliche Kosten für die Dauer der überlappenden Bereitstellungen.
| Schritte | Hinweise |
|---|---|
| Festlegen der Verlängerungsrichtlinie für den bestehenden Prepaidtarif auf Ablauf | Dadurch wird verhindert, dass das Commitment verlängert wird und weitere Gebühren generiert werden. |
| Vor Ablauf der bestehenden Verpflichtung: 1. Erstellen Sie das Commitment für die neue Ressource. 2. Erstellen Sie die neue Bereitstellung. 3. Leiten Sie den Datenverkehr um. 4. Löschen Sie die vorhandene Bereitstellung |
Stellen Sie sicher, dass Sie genügend Zeit für alle Schritte lassen, bevor das bestehende Commitment abläuft, andernfalls werden Überschreitungsgebühren für Optionen generiert (siehe nächster Abschnitt). |
Wenn der letzte Schritt länger als erwartet dauert und nach Ablauf des bestehenden Commitments abgeschlossen wird, gibt es drei Optionen, um Überschreitungsgebühren zu minimieren.
- Downtime nutzen: Löschen Sie die ursprüngliche Bereitstellung, und schließen Sie die Umstellung ab.
- Überschreitung bezahlen: Behalten Sie die ursprüngliche Bereitstellung bei, und zahlen Sie stündlich, bis Sie den Datenverkehr umgeleitet und die Bereitstellung gelöscht haben.
- Setzen Sie das ursprüngliche Commitment zurück, um es erneut zu verlängern. Dadurch erhalten Sie Zeit, um den Übergang mit den bekannten Kosten abzuschließen.
Sowohl das Bezahlen einer Überschreitung als auch das Zurücksetzen der ursprünglichen Verpflichtung verursachen Gebühren, die das ursprüngliche Ablaufdatum überschreiten. Das Bezahlen von Zusatzgebühren kann günstiger sein als ein neuer einmonatiger Vertrag, wenn Sie nur ein bis zwei Tage benötigen, um den Übergang abzuschließen. Vergleichen Sie die Kosten beider Optionen, um den Ansatz mit den niedrigsten Kosten zu finden.
Verschieben der Bereitstellung in eine neue Region oder ein neues Abonnement
Die gleichen Ansätze gelten beim Verschieben des Commitments und der Bereitstellung innerhalb der Region, mit der Ausnahme, dass in allen Fällen ein verfügbares Kontingent am neuen Standort erforderlich ist.
Anzeigen und Bearbeiten einer vorhandenen Ressource
Wählen Sie in Foundry Verwaltungszentrum>Kontingent>Bereitgestellt>Mindestabnahmen verwalten und dann eine Ressource mit einer vorhandenen Mindestabnahme aus, um sie anzuzeigen/zu ändern.