Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Microsoft heeft verbeteringen geïntroduceerd in de ingerichte doorvoer die betrekking hebben op feedback van klanten over bruikbaarheid en operationele flexibiliteit die nieuwe betalingsopties en implementatiescenario's openen.
Dit artikel is bedoeld voor bestaande gebruikers van de ingerichte doorvoercapaciteit. Nieuwe klanten moeten verwijzen naar de ingerichte onboardinghandleiding voor Azure OpenAI.
Wat verandert er?
Belangrijk
Dit artikel beschrijft de veranderingen die zijn aangebracht in de geprovisioneerde beheerde aanbieding in augustus en december 2024. Deze wijzigingen zijn niet van toepassing op de oudere aanbieding 'Ingericht klassiek (PTU-C)' . Ze zijn alleen van invloed op de voorziening Voorzien (ook wel Voorzien Beheerd genoemd).
Bruikbaarheidsverbeteringen
Eigenschap | Voordeel |
---|---|
Modelonafhankelijk quotum | Eén quotumlimiet voor alle modellen/versies vermindert het quotumbeheer en versnelt experimenten met nieuwe modellen. |
Zelfbedieningsquota-aanvragen | Verhogingen van het quotum aanvragen zonder het verkoopteam in te schakelen. Veel kunnen automatisch worden goedgekeurd. |
Standaard voorziene en beheerde quota in veel regio's | Ga snel aan de slag zonder dat u eerst quotum hoeft aan te vragen. |
Transparante informatie over beschikbaarheid van realtime capaciteit + nieuwe implementatiestroom | Verminderde onderhandeling over beschikbaarheid versnelt de marktintroductietijd. |
In de gegevenszone geconfigureerde implementaties | Hiermee kunt u de wereldwijde infrastructuur van Azure gebruiken om verkeer dynamisch te routeren naar het datacenter binnen de door Microsoft gedefinieerde gegevenszone met de beste beschikbaarheid voor elke aanvraag. Zie het artikel over implementatietypen voor meer informatie. |
Nieuw commercieel model op uurbasis en reserveringbasis
Eigenschap | Voordeel |
---|---|
Niet-binding, optie Per uur | De optie voor betaling per uur zonder binding maakt implementatiescenario's op korte termijn mogelijk. Ideaal voor het testen van nieuwe modellen en het beoordelen van de voordelen van ingerichte doorvoer. |
Termijnkortingen via Azure-reserveringen | Azure-reserveringen bieden aanzienlijke kortingen ten opzichte van het uurtarief voor termijnen van een maand en een jaar en zijn flexibel inzetbaar, waardoor het beheer wordt geminimaliseerd en gekoppeld aan de huidige verplichtingen die afhankelijk zijn van beschikbare resources. |
Standaard voorziene en beheerde quota in veel regio's | Ga snel aan de slag in nieuwe regio's zonder eerst quotum aan te vragen. |
Flexibele keuze van betalingsmodel voor bestaande ingerichte klanten | Klanten met toezeggingen kunnen tot het einde van de levensduur van de momenteel ondersteunde modellen op het toezeggingsmodel blijven en ervoor kiezen om bestaande toezeggingen te migreren naar per uur/tarievenreserveringen via een beheerd proces. We raden u aan om over te stappen naar uurlijkse reserveringen om te profiteren van periodekortingen en te werken met de nieuwste modellen. |
Ondersteunt de nieuwste modelgeneraties | De nieuwste modellen zijn alleen beschikbaar bij uurlijkse reserveringen in de speciaal ingerichte aanbieding. |
Gedifferentieerde prijzen | Meer flexibiliteit en controle over prijzen en prestaties. In december 2024 hebben we gedifferentieerde prijzen per uur geïntroduceerd voor de wereldwijde ingerichte, ingerichte gegevenszone en regionale implementatietypen met de optie om Azure-reserveringen aan te schaffen ter ondersteuning van extra kortingen. Zie de pagina Prijsgegevens voor meer informatie over de uurprijs voor elk ingerichte implementatietype. |
Details van bruikbaarheidsverbetering
De ingerichte quotumgranulariteit verandert van modelspecifiek in modelonafhankelijk. In plaats van elk model en elke versie binnen het abonnement en elke regio met een eigen quotumlimiet, is er één quotumitem per abonnement en regio die het totale aantal PTU's beperkt dat kan worden geïmplementeerd in alle ondersteunde modellen en versies.
Modelonafhankelijk quotum
Vanaf 12 augustus 2024 is het huidige modelspecifieke quotum van bestaande klanten geconverteerd naar modelonafhankelijk. Dit gebeurt automatisch. Er gaat geen quotum verloren tijdens de overgang. Bestaande quotumlimieten worden opgeteld en toegewezen aan een nieuw modelonafhankelijk quotumitem.
Het nieuwe modelonafhankelijke quotum wordt weergegeven als een quotumitem met de naam Ingerichte beheerde doorvoereenheid, waarbij het model en de versie niet meer zijn opgenomen in de naam. Als u het quotumitem van Azure AI Foundry uitbreidt, worden nog steeds alle implementaties weergegeven die bijdragen aan het quotumitem.
Standaardquotum
Nieuwe en bestaande abonnementen krijgen in veel regio's een klein aantal ingerichte quota toegewezen. Hierdoor kunnen klanten deze regio's gaan gebruiken zonder dat ze eerst quotum hoeven aan te vragen.
Als de regio al een quotumtoewijzing bevat, wordt de quotumlimiet niet gewijzigd voor de regio voor bestaande klanten. Het wordt bijvoorbeeld niet automatisch verhoogd met het nieuwe standaardbedrag.
Zelfbedieningsquota-aanvragen
Klanten krijgen geen quotum meer door contact op te leggen met hun verkoopteams. In plaats daarvan gebruiken ze het aanvraagformulier voor selfservicequota en geven ze het door PTU beheerde quotumtype op. Het formulier is toegankelijk via een koppeling naar rechts van het quotumitem. Het doel is om binnen twee werkdagen te reageren op alle quotumaanvragen.
De volgende quotaschermafbeelding toont modelonafhankelijk quotum dat wordt gebruikt door implementaties van verschillende typen en de koppeling voor het aanvragen van extra quota.
Quotum als limiet
Vóór de update van augustus was Azure OpenAI ingericht alleen beschikbaar voor een paar klanten en werd het quotum toegewezen om de mogelijkheid te maximaliseren om deze te implementeren en te gebruiken. Met deze wijzigingen wordt het proces voor het verkrijgen van quota voor alle gebruikers vereenvoudigd en is er een grotere kans dat er sprake is van servicecapaciteitsbeperkingen wanneer implementaties worden geprobeerd. Er is een nieuwe API- en portal-ervaring beschikbaar om gebruikers te helpen regio's te vinden waarvoor het abonnement quota heeft en de service capaciteit heeft om implementaties van een gewenst model te ondersteunen.
Het is ook raadzaam dat klanten die toezeggingen gebruiken, nu hun implementaties maken voordat ze toezeggingen maken of uitbreiden om ze te dekken. Dit garandeert dat de capaciteit beschikbaar is voordat u een toezegging maakt en voorkomt dat de toezegging te veel wordt aangeschaft. Ter ondersteuning hiervan is de beperking die verhinderde dat implementaties groter worden gemaakt dan hun toezeggingen, verwijderd. Deze nieuwe benadering voor quotum, beschikbaarheid van capaciteit en toezeggingen komt overeen met wat wordt geboden onder het model voor uur/reservering, en de richtlijnen voor implementatie voordat u een toezegging koopt (of reservering, voor het uurmodel) is hetzelfde voor beide.
Zie de volgende koppelingen voor meer informatie. De richtlijnen voor reserveringen en toezeggingen zijn hetzelfde:
Nieuw betalingsmodel voor reservering per uur
Opmerking
De volgende beschrijving van betalingsmodellen is niet van toepassing op de oudere aanbieding 'Ingericht klassiek (PTU-C)'. Ze zijn alleen van invloed op de Provisioned (ook wel Provisioned Managed genoemd) aanbieding. Provisioned Classic blijft vallen onder het ongewijzigde maandelijkse commitment-betalingsmodel.
Microsoft heeft een nieuw betalingsmodel 'uurlijkse/reserverings' geïntroduceerd voor geprovisioneerde implementaties. Dit is een aanvulling op het huidige betalingsmodel voor toezeggingen , dat wordt ondersteund tot het einde van de levensduur van de momenteel ondersteunde beperkte modellijst. Raadpleeg de ondersteunde modellen op het Commitment-betalingsmodel voor de lijst met ondersteunde modellen van het Commitment-betalingsmodel. U hebt ook de mogelijkheid om Azure-reserveringen aan te schaffen ter ondersteuning van extra kortingen.
Nieuwe Azure-reserveringen voor wereldwijde implementaties en geconfigureerde implementaties in de gegevenszone
Naast de updates voor het betalingsmodel per uur, zijn in december 2024 nieuwe Azure-reserveringen specifiek geïntroduceerd voor de implementatietypen voor wereldwijde en ingerichte gegevenszones. Met deze nieuwe Azure-reserveringen heeft elk ingerichte implementatietype een afzonderlijke Azure-reservering die kan worden aangeschaft ter ondersteuning van extra kortingen. ** De relatie tussen elk ingericht implementatietype en de bijbehorende Azure-reservering is als volgt:
Voorzien implementatietype | SKU-naam in code | Productnaam van Azure-reservering |
---|---|---|
Wereldwijd geprovisioneerd | GlobalProvisionedManaged |
Wereldwijd beheer van voorzieningen |
Gegevenszone toegewezen | DataZoneProvisionedManaged |
Ingerichte beheerde gegevenszone |
Geconfigureerd | ProvisionedManaged |
Voorzien Beheerd Regionaal |
Belangrijk
Azure-reserveringen voor ingerichte Azure OpenAI-aanbiedingen zijn niet uitwisselbaar tussen implementatietypen. De aangeschafte Azure-reservering moet overeenkomen met het ingerichte implementatietype. Als de aangeschafte Azure-reservering niet overeenkomt met het ingerichte implementatietype, wordt de ingerichte implementatie standaard ingesteld op het betalingsmodel per uur totdat een overeenkomend Azure-reserveringsproduct is gekocht. Zie de richtlijnen voor geprovisioneerde Azure-reserveringen voor Azure OpenAI in Azure AI Foundry Models voor meer informatie.
Betalingsmodel voor verplichtingen
Een maandelijkse regionale toezegging is vereist voor het gebruik van de aangeboden diensten (langere voorwaarden zijn contractueel beschikbaar).
Toezeggingen zijn gebonden aan Azure OpenAI-resources, waardoor het verplaatsen van implementaties tussen resources lastig wordt.
Toezeggingen kunnen niet worden geannuleerd of gewijzigd tijdens hun looptijd, behalve om nieuwe PTU's toe te voegen.
Ondersteunde modellen voor toezeggingsbetalingsmodel:
Alleen de volgende lijst met Azure OpenAI-modellen wordt ondersteund in Toezeggingen. Voor het onboarden van andere modellen die niet in de onderstaande lijst staan, of nieuwere modellen met toegewezen doorvoeraanbiedingen, raadpleegt u de Azure OpenAI toegewezen onboardinghandleiding en Azure-reserveringen voor toegewezen implementaties van Azure OpenAI
Ondersteunde modellen bij toezeggingsplan | Versies |
---|---|
gpt-35-turbo | 0125,1106 |
gpt-4 | 0613, 1106-Preview, 0125-Preview |
gpt-4-turbo | 9 april 2024 |
gpt-4-32k | 0613 |
gpt-4o | 2024-05-13, 2024-08-06 |
gpt-4o-mini | 18-07-2024 |
Betalingsmodel voor reservering per uur
Het betalingsmodel is afgestemd op Azure-standaarden voor andere producten.
Gebruik per uur wordt ondersteund, zonder toezegging.
Kortingen voor één maand en één jaar kunnen worden aangeschaft als regionale Azure-reserveringen.
Reserveringen kunnen flexibel worden afgestemd op meerdere abonnementen en het bereik kan op de middellange termijn worden gewijzigd.
Ondersteunt alle modellen, zowel oud als nieuw.
Belangrijk
Er zijn meer recente modellen beschikbaar in het ingerichte aanbod met het betalingsmodel per uur/reservering. Bekijk de lijst hier voor de availabilityModels die niet in de bovenstaande lijst staan, kunnen niet worden geïmplementeerd in Azure OpenAI-resources die actieve toezeggingen hebben. Als u nieuwere modellen wilt implementeren, moet u het volgende doen:
- Maak implementaties op Azure OpenAI-resources zonder toezeggingen.
- Migreer een bestaande resource buiten de toezeggingen.
Framework voor betalingsmodellen
Met de release van het betalingsmodel per uur/gereserveerd zijn betalingsopties flexibeler en is het betalingsmodel voor vooraf voorzien betalingen gewijzigd. Toen maandelijkse toezeggingen de enige manier waren om voorzieningen te verkrijgen, was het model:
- Haal een PTU-quotum op van uw Microsoft-accountteam.
- Koop quota vanuit een overeenkomst voor de resource waar u wilt uitrollen.
- Maak implementaties voor de hulpbron tot aan de limiet van de verplichting.
Het belangrijkste verschil tussen dit model en het nieuwe model is dat de enige manier om eerder te betalen voor de diensten via een korting gebaseerd op een looptijd van één maand was. U kunt nu kiezen om implementaties per uur uit te rollen en ervoor te betalen. Daarnaast kunt u afzonderlijk beslissen of u deze met korting wilt aanbieden via een toezegging van één maand (zoals voorheen) of een Azure-reservering.
Met dit inzicht is de nieuwe manier om na te denken over betalingsmodellen:
- Haal een PTU-quotum op met behulp van het selfserviceformulier.
- Maak implementaties met behulp van uw quotum.
- U kunt eventueel een toezegging of reservering aanschaffen of verlengen om een termijnkorting toe te passen op uw implementaties.
Stap 1 en 2 zijn in alle gevallen hetzelfde. Het verschil is of een toezegging of een Azure-reservering wordt gebruikt als middel om de korting te verstrekken. In beide modellen:
Het is mogelijk om meer PTU's te implementeren dan u korting krijgt. (bijvoorbeeld het maken van een tijdelijke implementatie om een nieuw model uit te proberen, wordt mogelijk gemaakt door zonder korting te implementeren)
De kortingsmethode (toezegging of reservering) past de kortingsprijs toe op een vast aantal PTU's en heeft een bereik dat bepaalt welke implementaties worden meegeteld op basis van de korting.
Kortingstype Beschikbare toepassingen (binnen een regio) Toewijding Azure OpenAI-resource Reservering Resourcegroep, één abonnement, beheergroep (groep abonnementen), gedeeld (alle abonnementen in een factureringsrekening) De verlaagde prijs wordt toegepast op geïmplementeerde PTU's tot het aantal kortings-PTU's in de aanbieding.
Het aantal ingeschakelde PTU's dat de gereduceerde PTU's overschrijdt (of niet onder enige korting valt) zal het uurtarief in rekening worden gebracht.
De best practice is om eerst implementaties te maken en vervolgens kortingen toe te passen. Dit is om die service te garanderen. capaciteit is beschikbaar ter ondersteuning van uw implementaties voordat u een termijnovereenkomst voor PTU's maakt die u niet kunt gebruiken.
Opmerking
Wanneer u de beste praktijken volgt, kunnen er uurkosten ontstaan tussen het moment dat u de implementatie maakt en uw korting verhoogt (toezegging of reservering).
Daarom raden we u aan uw korting direct na de implementatie te verhogen. De vereisten voor het aanschaffen van Azure-reserveringen zijn anders dan voor toezeggingen. U wordt aangeraden deze vóór de implementatie te valideren als u ze wilt gebruiken om uw implementatie te korting te geven. Zie Machtigingen voor het weergeven en beheren van Azure-reserveringen voor meer informatie
Implementaties koppelen aan kortingsmethode
Klanten die vóór augustus 2024 gebruikmaken van de ingerichte Azure OpenAI-aanbieding, kunnen een of beide betalingsmodellen tegelijk binnen een abonnement gebruiken. Het betalingsmodel dat voor elke implementatie wordt gebruikt, wordt bepaald op basis van de Azure OpenAI-resource:
Resource heeft een actieve toezegging
- De verplichting biedt kortingen op alle implementaties op de resource tot het aantal PTU's binnen de verplichting. Alle overtollige PTU's worden per uur gefactureerd, tenzij deze overtollige PTU's niet binnen de scope van een actieve reservering vallen. Als de overtollige PTU's binnen de scope van een actieve reservering bestaan, worden zij als groep gekort, tot het aantal PTU's op de reservering, en indien er nog steeds overtollige overloop is, zal deze per uur worden gefactureerd.
Resource heeft geen actieve toezegging
- De uitrol binnen de resource is in aanmerking voor korting via een Azure-reservering. Om deze implementaties in aanmerking te komen voor korting, moeten ze binnen de omvang van een actieve reservering vallen. Alle implementaties binnen het bereik van de reservering (inclusief mogelijke implementaties op andere resources binnen hetzelfde abonnement of andere abonnementen) worden als een groep gekort tot en met het aantal PTU's van de reservering. Eventuele overtollige PTU's worden per uur gefactureerd.
Wijzigingen in de bestaande betalingsmodus
Klanten die vandaag toezeggingen hebben, kunnen deze ten minste blijven gebruiken totdat het ondersteunde model buiten gebruik wordt gesteld. ** Dit omvat het aanschaffen van nieuwe PTU's voor nieuwe of bestaande toezeggingen en het beheren van verlengingen van toezeggingen. De update van augustus heeft echter bepaalde aspecten van de werking van verplichtingen gewijzigd.
Azure OpenAI biedt vanaf 1 augustus 2024 geen ondersteuning meer voor inschrijving voor nieuwe toezeggingen
Er kan slechts een beperkte set modellen worden geïmplementeerd op een resource met een toezegging. Hier volgt de lijst met modellen
Als de geïmplementeerde PTU's onder een toezegging de vastgelegde PTU's overschrijden, worden de kosten voor overschrijding per uur toegerekend aan dezelfde uurmeter die wordt gebruikt voor het nieuwe uur-/reserveringsbetalingsmodel. Hierdoor kunnen de overschrijdingskosten worden gereduceerd via een Azure-reservering.
Het is mogelijk om meer PTU's te implementeren dan is vastgelegd voor de resource. Dit biedt ondersteuning voor de mogelijkheid om capaciteitsbeschikbaarheid te garanderen voordat de toezeggingsgrootte wordt verhoogd.
Bestaande middelen buiten verplichtingen migreren
Bestaande klanten kunnen ervoor kiezen om hun bestaande resources te migreren van de toezegging naar het betalingsmodel per uur/reservering om te profiteren van de mogelijkheid om de nieuwste modellen te implementeren of om korting voor diverse implementaties onder één reservering samen te voegen.
Er zijn twee benaderingen beschikbaar voor klanten om resources te migreren vanuit het Commitment-model naar het Uur-/Reserveringsmodel.
Selfservice migratie
Met de selfservicemigratiebenadering kan een klant hun middelen geleidelijk vrijmaken door hun verplichtingen organisch te laten verlopen. Het proces voor het migreren van een resource is als volgt:
Stel de bestaande toezegging in om niet automatisch te verlengen en noteer de vervaldatum.
Vóór de vervaldatum moet een klant een Azure-reservering aanschaffen voor het totale aantal vastgelegde PKU's per abonnement. Als een bestaande reservering het abonnement al onder zijn reikwijdte heeft, kan deze vergroot worden om de nieuwe PTU's te dekken.
Wanneer de toezegging verloopt, schakelen de implementaties onder de resource automatisch over naar de modus per uur/reservering, waarbij het gebruik door de reservering wordt verkort.
Deze benadering van zelfservicemigratie resulteert in een overlapping waarbij zowel de reservering als de verplichting actief zijn. Dit is een kenmerk van deze migratiemodus en de reserverings- of toezeggingstijd voor deze overlapping wordt niet teruggeschreven naar de klant.
Een alternatieve benadering voor selfservicemigratie is om de reserveringsaankoop te laten plaatsvinden na afloop van de toezegging. In deze benadering genereren de implementaties elk uur gebruik voor de periode tussen de vervaldatum van de toezegging en de aankoop van de reservering. Net als bij het vorige model is dit een kenmerk van deze benadering en wordt dit gebruik per uur niet gecrediteerd.
Voordelen van selfservicemigratie:
- Afzonderlijke resources kunnen op verschillende tijdstippen worden gemigreerd.
- Klanten beheren de migratie zonder afhankelijkheden van Microsoft.
Nadelen van selfservicemigratie:
- Er zal een korte periode zijn van dubbel gefactureerd worden of uurtarieven tijdens de overschakeling van vast abonnementen naar uur- of reserveringsbetaling.
Belangrijk
De zelfbedieningsbenadering genereert extra kosten wanneer de betalingsmodus wordt overgeschakeld van Vastgelegd naar Uurbasis of Reservering. Dit zijn de kenmerken van deze migratiebenaderingen en klanten worden niet gecrediteerd voor deze kosten.
Bestaande implementaties migreren naar globale of van gegevenszone voorziene locaties
Bestaande klanten van geconfigureerde implementaties kunnen ervoor kiezen om te migreren naar wereldwijde implementaties of geconfigureerde gegevenszones om te profiteren van de lagere implementatieminimums, gedetailleerde schaalverhogingen of gedifferentieerde prijzen die beschikbaar zijn voor deze implementatietypen. Zie voor meer informatie over hoe de ingerichte implementaties in globale en gegevenszones omgaan met gegevensverwerking in verschillende Azure-geografische gebieden de Azure OpenAI-implementatie documentatie voor gegevensverwerking.
Er zijn twee benaderingen beschikbaar voor klanten om te migreren van ingerichte implementaties naar globale of in een gegevenszone ingerichte implementaties.
Migratie zonder downtime
De nul-downtime migratiebenadering stelt klanten in staat hun bestaande ingerichte implementaties te migreren naar zowel wereldwijde als in gegevenszone ingerichte implementaties, zonder het bestaande inference-verkeer op hun implementatie te onderbreken. Deze migratiebenadering minimaliseert onderbrekingen van de werkbelasting, maar vereist wel dat de klant meerdere coëxisterende implementaties heeft terwijl het netwerkverkeer wordt overgezet. Het proces voor het migreren van een ingerichte implementatie met behulp van de migratiebenadering zonder downtime is als volgt:
- Maak een nieuwe implementatie aan door gebruik te maken van implementatietypen die zijn ingericht voor de globale zone of gegevenszone binnen de beoogde Azure OpenAI-resource.
- Verkeer overzetten van het bestaande regionale ingerichte implementatieconfiguratie naar de zojuist gemaakte globale of gegevenszone ingestelde implementatie totdat al het verkeer is overgezet van de bestaande regionale ingerichte implementatie.
- Zodra het verkeer naar de nieuwe implementatie is gemigreerd, controleert u of er geen inferentieverzoeken worden verwerkt in de eerder ingerichte implementatie. Dit doet u door na te gaan dat de Azure OpenAI-verzoekenmetrieken geen API-aanroepen tonen binnen 5-10 minuten nadat het inferentieverkeer naar de nieuwe implementatie is overgezet. Voor meer informatie over deze metriek, zie de documentatie voor Monitor Azure OpenAI.
- Nadat u hebt bevestigd dat er geen inference-aanroepen zijn gedaan, verwijdert u de regionale geprovisioneerde implementatie.
Migratie met downtime
De migratie met de strategie met downtime omvat het migreren van bestaande ingerichte implementaties naar globale implementaties of implementaties in een gegevenszone, terwijl het bestaande inferentieverkeer op de oorspronkelijke ingerichte implementatie wordt gestopt. Deze migratiebenadering vereist geen co-existentie van meerdere implementaties ter ondersteuning, maar vereist wel een onderbreking van de werkbelasting. Het proces voor het migreren van een ingerichte implementatie met behulp van de migratie met downtime is als volgt:
- Verifieer dat er geen inference-aanvragen worden verwerkt op de vorige geprovisioneerde implementatie door ervoor te zorgen dat de metriek Azure OpenAI-aanvragen in de afgelopen 5-10 minuten geen API-aanroepen laat zien. Voor meer informatie over deze metriek, zie de documentatie voor Monitor Azure OpenAI.
- Nadat u hebt bevestigd dat er geen inference-aanroepen zijn gedaan, verwijdert u de regionale geprovisioneerde implementatie.
- Maak een nieuwe implementatie met behulp van de algemene implementatietypen of typen gegevenszones in de Azure OpenAI-doelresource.
- Zodra uw nieuwe implementatie is geslaagd, kunt u het deductieverkeer hervatten voor de nieuwe wereldwijde implementatie of de implementatie van de gegevenszone.
Hoe kan ik mijn bestaande Azure-reservering migreren naar de nieuwe Azure-reserveringsproducten?
Azure-reserveringen voor ingerichte Azure OpenAI-aanbiedingen zijn specifiek voor het ingerichte implementatietype. Als de aangeschafte Azure-reservering niet overeenkomt met het ingerichte implementatietype, wordt de implementatie standaard ingesteld op het betalingsmodel per uur. Als u ervoor kiest om te migreren naar globale implementaties of ingerichte gegevenszones, moet u mogelijk een nieuwe Azure-reservering aanschaffen voor deze implementaties ter ondersteuning van extra kortingen. Zie de Azure-reserveringen voor Azure OpenAI ingerichte richtlijnen voor meer informatie over het aanschaffen van een nieuwe Azure-reservering of wijzigingen aanbrengen in een bestaande Azure-reservering.
Geprovisioneerde doorvoertoezeggingen beheren
Gereguleerde doorvoertoezeggingen worden gecreëerd en beheerd door Management center te selecteren in het navigatiemenu van de Azure AI Foundry-portal>Quota>Manage Commitments.
In de weergave Toezeggingen beheren kunt u verschillende dingen doen:
- Koop nieuwe toezeggingen of bewerk bestaande toezeggingen.
- Controleer alle toezeggingen in uw abonnement.
- Identificeer en onderneem actie op toezeggingen die onverwachte facturering kunnen veroorzaken.
In de volgende secties wordt u door deze taken begeleid.
Een geconfigureerde doorvoercapaciteitstoezegging aanschaffen
Nu uw toezeggingsplan klaar is, is de volgende stap het maken van de toezeggingen. Verplichtingen worden handmatig gemaakt via Azure AI Foundry en vereisen dat de gebruiker die de verplichting aangaat de rol van Bijdrager of Cognitive Services-Bijdrager op abonnementsniveau heeft.
Voer voor elke nieuwe toezegging die u moet maken de volgende stappen uit:
- Start het dialoogvenster voor het kopen van ingerekende doorvoersnelheid door Quota>Azure OpenAI Provisioned> en Beheer toegezegde plannen te selecteren.
Selecteer Aankoopverplichting.
Selecteer de Azure OpenAI-resource en koop de toezegging. U ziet dat uw resources zijn onderverdeeld in resources met bestaande toezeggingen, die u kunt bewerken en resources die momenteel geen toezegging hebben.
Configuratie | Opmerkingen |
---|---|
Een resource selecteren | Kies de resource waar u de ingerichte implementatie gaat maken. Zodra u de toezegging hebt aangeschaft, kunt u de PTU's niet gebruiken op een andere resource totdat de huidige toezegging is verlopen. |
Een toezeggingstype selecteren | Selecteer Geconfigureerd. (Ingericht staat gelijk aan Ingericht beheerd) |
Huidig niet-toegekend voorziene quotum | Het aantal PTU's dat u momenteel kunt toewijzen aan deze bron. |
Bedrag dat moet worden doorgevoerd (PTU) | Kies het aantal PTU's dat u wilt vastleggen. Dit aantal kan worden verhoogd tijdens de toezeggingstermijn, maar kan niet worden verlaagd. Voer waarden in stappen van 50 in voor het toezeggingstype Ingericht. |
Toezeggingslaag voor de huidige periode | De toezeggingsperiode is ingesteld op één maand. |
Verlengingsinstellingen | Automatisch verlengen bij huidige PTU's Automatisch vernieuwen bij lagere PTU's Niet automatisch verlengen |
- Selecteer Aankopen. Er wordt een bevestigingsvenster weergegeven. Nadat u hebt bevestigd, worden uw PPU's doorgevoerd en kunt u deze gebruiken om een ingerichte implementatie te maken. |
Belangrijk
Voor de hele termijn wordt een nieuwe toezegging vooraf gefactureerd. Als de verlengingsinstellingen zijn ingesteld op automatisch verlengen, wordt u opnieuw gefactureerd op elke verlengingsdatum op basis van de verlengingsinstellingen.
Een bestaande toezegging voor voorzien doorvoer bewerken
In de weergave Toezeggingen beheren kunt u ook een bestaande toezegging bewerken. Er zijn twee soorten wijzigingen die u kunt aanbrengen in een bestaande toezegging:
- U kunt PTU's toevoegen aan de toezegging.
- U kunt de verlengingsinstellingen wijzigen.
Als u een toezegging wilt bewerken, selecteert u de huidige die u wilt bewerken en selecteert u De toezegging bewerken.
Ingerichte doorvoereenheden toevoegen aan bestaande toezeggingen
Door PTU's toe te voegen aan een bestaande toezegging, kunt u grotere of meer implementaties binnen de resource maken. U kunt dit op elk gewenst moment doen tijdens de looptijd van uw toezegging.
Belangrijk
Wanneer u PTU's toevoegt aan een toezegging, worden ze onmiddellijk gefactureerd op een pro rato bedrag van de huidige datum tot het einde van de bestaande toezeggingstermijn. Als u PTU's toevoegt, wordt de toezeggingstermijn niet opnieuw ingesteld.
Verlengingsinstellingen wijzigen
Instellingen voor het verlengen van toezeggingen kunnen op elk gewenst moment vóór de vervaldatum van uw toezegging worden gewijzigd. Redenen waarom u de verlengingsinstellingen wilt wijzigen, zijn onder andere het beëindigen van het gebruik van ingerichte doorvoer door de toezegging in te stellen om niet automatisch opnieuw te worden verlengd of om het gebruik van ingerichte doorvoer te verlagen door het aantal PTU's te verlagen dat in de volgende periode wordt doorgevoerd.
Belangrijk
Als u toestaat dat een toezegging verloopt of in omvang afneemt, waardoor de implementaties onder de bron meer PTU's nodig hebben dan in uw resource-toezegging zijn vastgelegd, ontvangt u per uur overschrijdingskosten voor eventuele overtollige PTU's. Een resource met implementaties met een totaal van 500 PTU's en een toezegging voor 300 PTU's genereert bijvoorbeeld uuroverschrijdingskosten voor 200 PTU's.
Toezeggingen bewaken en onverwachte facturering voorkomen
De sectie Toezeggingen beheren biedt een overzicht van alle resources met toezeggingen en PTU-gebruik binnen een bepaald Azure-abonnement. Van bijzonder belang zijn:
- PTU’s toegezegd, geïmplementeerd en gebruik – deze cijfers bieden de omvang van uw toezeggingen en hoeveel wordt gebruikt door implementaties. Maximaliseer uw investering door al uw vastgelegde PTU's te gebruiken.
- Verloopbeleid en -datum : de vervaldatum en het beleid geven aan wanneer een toezegging verloopt en wat er gebeurt wanneer dit gebeurt. Een toezegging die is ingesteld op automatisch verlengen, genereert een factureringsevenement op de verlengingsdatum. Voor verplichtingen die aflopen, moet u ervoor zorgen dat u implementaties van deze resources vóór de vervaldatum verwijdert om overmatige uurfacturering te voorkomen. De huidige verlengingsinstellingen voor een verplichting.
- Meldingen : waarschuwingen met betrekking tot belangrijke voorwaarden, zoals ongebruikte toezeggingen en configuraties die kunnen leiden tot factureringsoverschrijdingen. Factureringsoverschrijdingen kunnen worden veroorzaakt door situaties zoals wanneer een toezegging is verlopen en implementaties nog steeds aanwezig zijn, maar zijn overgeschakeld naar facturering per uur.
Belangrijk
Als u een toezegging instelt voor automatisch verlengen , is de verlengingsdatum dezelfde datum volgende maand. Als de datum niet bestaat, is de verlengingsdatum het einde van de maand.
Voorbeelden-
Scenario 1: Als u een toezegging koopt op 21 februari en de toezegging voor automatisch verlengen instelt, is de volgende verlengingsdatum voor de toezegging 21 maart.
Scenario 2: Als u de toezegging op 31 mei aanschaft en de toezegging voor automatisch verlengen instelt, wordt de volgende verlengingsdatum voor de toezegging 30 juni (einde van de maand) omdat er geen 31e is in de maand juni.
Scenario 3: Als u de toezegging op 31 januari aanschaft en de toezegging instelt voor automatisch verlengen, wordt de volgende verlengingsdatum voor de toezegging 28 februari (einde van de maand) omdat er geen 31e of 30e of 29e (in niet-schrikkeljaren) is en de verlengingsdatum 29 februari (in een schrikkeljaar) zou zijn in de maand februari.
Veelvoorkomende scenario's voor toezeggingsbeheer
Het gebruik van ingerichte doorvoer stopzetten
Als u het gebruik van ingerichte doorvoer wilt beëindigen en overschrijdingskosten per uur wilt voorkomen na afloop van een toezegging, moet u na het verstrijken van de huidige toezeggingen twee stappen ondernemen:
- Stel het verlengingsbeleid voor alle toezeggingen in op Niet automatisch opnieuw verlengen.
- Verwijder de ingerichte implementaties door het quotum te gebruiken.
Belangrijk
Als u een verplichting toestaat om te verlopen met de intentie om de geconfigureerde doorvoersnelheid te stoppen en de geconfigureerde implementaties niet te verwijderen, ontvangt u elk uur extra kosten voor alle PTU's die zich nog in de implementatie bevinden. Een resource met deployments van in totaal 500 PTU's waarvoor 'Niet automatisch verlengen' is gekozen, brengt na het verstrijken van die toezegging elk uur kosten in rekening totdat de deployment is verwijderd. Er is momenteel geen optie beschikbaar waarmee de implementatie automatisch wordt verwijderd. Deze moet handmatig worden verwijderd wanneer u besluit het gebruik van ingerichte doorvoer te stoppen.
Een toezegging/implementatie verplaatsen naar een nieuwe resource in hetzelfde abonnement/dezelfde regio
Het is niet mogelijk in Azure AI Foundry om een implementatie of een toezegging voor een nieuwe resource rechtstreeks te verplaatsen . In plaats daarvan moet er een nieuwe implementatie op de doelresource worden gemaakt en moet het verkeer ernaartoe worden verplaatst. Er moet een engagement gekocht worden dat is gebaseerd op de nieuwe resource om dit doel te bereiken. Omdat toezeggingen vooraf in rekening worden gebracht voor een periode van 30 dagen, is het noodzakelijk om deze verplaatsing te timen met de vervaldatum van de oorspronkelijke toezegging om overlapping met de nieuwe toezegging en dubbele facturering tijdens de overlapping te minimaliseren.
Er zijn twee benaderingen die kunnen worden gebruikt om deze overgang te implementeren.
Optie 1: Overschakeling zonder overlapping
Deze optie vereist enige downtime, maar vereist geen extra quotum en genereert geen extra kosten.
Stappen | Opmerkingen |
---|---|
Het verlengingsbeleid van de bestaande toezegging instellen zodat deze afloopt | Dit voorkomt dat de toezegging wordt verlengd en verdere kosten worden gegenereerd |
Voordat de bestaande toezegging is verlopen, verwijdert u de implementatie ervan | Downtime begint op dit moment en duurt totdat de nieuwe implementatie is gemaakt en verkeer wordt verplaatst. U minimaliseert de duur door de verwijdering zo dicht mogelijk bij de vervaldatum/-tijd te laten plaatsvinden. |
Nadat de bestaande toezegging is verlopen, maakt u de toezegging voor de nieuwe resource | Minimaliseer downtime door deze en de volgende stap zo snel mogelijk na de vervaldatum uit te voeren. |
Voer de implementatie uit op de nieuwe resource en verplaats het verkeer ernaartoe |
Optie 2: Gelijktijdige overstap
Deze optie heeft geen downtime doordat zowel bestaande als nieuwe implementaties tegelijkertijd live zijn. Hiervoor moet het quotum beschikbaar zijn om de nieuwe implementatie te maken en worden er extra kosten gegenereerd voor de duur van de overlappende implementaties.
Stappen | Opmerkingen |
---|---|
Het verlengingsbeleid van de bestaande toezegging instellen zodat deze afloopt | Als u dit doet, voorkomt u dat de toezegging wordt verlengd en verdere kosten worden gegenereerd. |
Voordat de bestaande toezegging verloopt: 1. Maak de toezegging voor de nieuwe resource. 2. Maak de nieuwe implementatie. 3. Verkeer wisselen 4. Bestaande implementatie verwijderen |
Zorg ervoor dat u voldoende tijd overlaat voor alle stappen voordat de bestaande toezegging verloopt, anders worden overschrijdingskosten gegenereerd (zie volgende sectie) voor opties. |
Als de laatste stap langer duurt dan verwacht en eindigt nadat de bestaande toezegging is verlopen, zijn er drie opties om overschrijdingskosten te minimaliseren.
- Neem downtime: verwijder de oorspronkelijke implementatie en voltooi de verplaatsing.
- Betaal overschrijdingskosten: behoud de oorspronkelijke implementatie en betaal per uur totdat u het verkeer hebt verplaatst en de implementatie hebt verwijderd.
- Stel de oorspronkelijke toezegging opnieuw in om nog één keer te verlengen. Dit geeft u tijd om met een bekende kost de verplaatsing te voltooien.
Zowel betalen voor een overschrijding als het opnieuw instellen van de oorspronkelijke toezegging genereren kosten na de oorspronkelijke vervaldatum. Het betalen van overschrijdingskosten is mogelijk goedkoper dan een nieuwe toezegging van één maand als u slechts een dag of twee nodig hebt om de verplaatsing te voltooien. Vergelijk de kosten van beide opties om de laagste kostenbenadering te vinden.
De implementatie verplaatsen naar een nieuwe regio en of abonnement
Dezelfde benaderingen zijn van toepassing bij het verplaatsen van de toezegging en implementatie binnen de regio, behalve dat het beschikbare quotum op de nieuwe locatie in alle gevallen vereist is.
Een bestaande resource weergeven en bewerken
In Azure AI Foundry selecteert u Beheercentrum>Quota>Ingericht>Toezeggingen beheren en selecteert u een resource met een bestaande toezegging om deze weer te geven of te wijzigen.