Partage via


Mises à jour de l'offre managée Azure OpenAI provisionnée (classique)

S'applique uniquement à :Portail Foundry (classique). Cet article n’est pas disponible pour le nouveau portail Foundry. En savoir plus sur le nouveau portail.

Microsoft a lancé des améliorations apportées à son offre de débit approvisionné qui répond aux commentaires des clients sur la facilité d’utilisation et l’agilité opérationnelle qui ouvrent de nouvelles options de paiement et scénarios de déploiement.

Cet article est destiné aux utilisateurs existants de l’offre de débit approvisionné. Les nouveaux clients doivent se référer au guide d'intégration provisionné Azure OpenAI.

Qu’est ce qui a changé ?

Important

Les modifications apportées à cet article décrivent les modifications apportées à l’offre gérée provisionnée en août et décembre 2024. Ces modifications ne s’appliquent pas à l’ancienne offre « Classique provisionné (PTU-C) ». Ils affectent uniquement l’offre Approvisionné (également appelée Approvisionné managé).

Améliorations de la convivialité

Caractéristique Avantage
Quota indépendant du modèle Une limite de quota unique couvrant tous les modèles/toutes les versions réduit l’administration des quotas et accélère l’expérimentation des nouveaux modèles.
Demandes de quota en libre-service Demander des augmentations de quota sans contacter l’équipe commerciale, beaucoup peuvent être approuvées automatiquement.
Quota approvisionné-approuvé par défaut dans de nombreuses régions Commencez rapidement sans avoir d'abord à demander un quota.
Des informations transparentes sur la disponibilité de capacité en temps réel + nouveau flux de déploiement Une négociation réduite de la disponibilité accélère le délai de commercialisation.
Déploiements provisionnés dans une zone de données Vous permet de tirer parti de l'infrastructure globale de Azure pour acheminer dynamiquement le trafic vers le centre de données au sein de la zone de données définie par Microsoft avec la meilleure disponibilité pour chaque requête. Pour plus d’informations, consultez l’article sur les types de déploiement .

Nouveau modèle commercial horaire/réservation

Caractéristique Avantage
Option Sans liaison, Heure L’option de paiement horaire sans liaison active les scénarios de déploiement à court terme. Idéal pour tester de nouveaux modèles et évaluer les avantages du débit approvisionné.
Remises à terme via les réservations de Azure Les réservations Azure offrent des remises substantielles sur le tarif horaire pour des durées d'un mois et d'un an, et proposent des périmètres flexibles qui réduisent l'administration, en lien avec les engagements liés aux ressources d'aujourd'hui.
Quota approvisionné-approuvé par défaut dans de nombreuses régions Commencez rapidement dans les nouvelles régions sans avoir besoin de demander des quotas au préalable.
Choix flexible du modèle de paiement pour les clients approvisionnés existants Les clients ayant des engagements peuvent rester sur le modèle d’engagement jusqu’à la fin de la durée de vie des modèles actuellement pris en charge et choisir de migrer des engagements existants vers des engagements horaires/réservations via un processus géré. Nous vous recommandons de migrer vers des réservations horaires pour tirer parti des remises à terme et utiliser les derniers modèles.
Prise en charge des dernières générations de modèles Les modèles les plus récents sont disponibles uniquement sur les réservations horaires/ dans l’offre provisionnée.
Tarification différenciée Plus de flexibilité et de contrôle des prix et des performances. En décembre 2024, nous avons introduit des tarifs horaires différenciés dans global provisionné, zone de données approvisionnée et région provisionnée avec la possibilité d’acheter des réservations Azure pour prendre en charge des remises supplémentaires. Pour plus d’informations sur le prix horaire de chaque type de déploiement approvisionné, consultez la page Détails des prix.

Détails sur l’amélioration de la facilité d’utilisation

La granularité des quotas provisionnés est passée d'un modèle spécifique à un modèle indépendant. Plutôt que chaque modèle et chaque version au sein d’un abonnement et d’une région aient leur propre limite de quota, il existe un élément de quota unique par abonnement et par région qui limite le nombre total de PTU pouvant être déployées sur tous les modèles et toutes les versions pris en charge.

Quota indépendant du modèle

Depuis le 12 août 2024, le quota actuel des clients existants, spécifique au modèle, a été converti en quotas indépendants du modèle. Cela s’est produit automatiquement. Aucun quota n’a été perdu dans la transition. Les limites de quota existantes ont été additionnées et affectées à un nouvel élément de quota indépendant du modèle.

Diagramme montrant la consolidation des quotas.

Le nouveau quota indépendant du modèle s’affiche sous la forme d’un élément de quota nommé Unité de débit managé provisionné, avec le modèle et la version qui ne sont plus inclus dans le nom. Dans le volet de quota de Microsoft Foundry, l'extension de l'élément de quota affiche toujours tous les déploiements qui y contribuent.

Quota par défaut

Une petite quantité de quota approvisionné est affectée à des abonnements nouveaux et existants dans plusieurs régions. Cela permet aux clients de commencer à utiliser ces régions sans avoir à demander d’abord un quota.

Pour les clients existants, si la région contient déjà une affectation de quota, la limite de quota n’est pas changée pour la région. Par exemple, elle n’est pas automatiquement augmentée par la nouvelle quantité par défaut.

Demandes de quota en libre-service

Les clients n’obtiennent plus un quota en contactant leur équipe commerciale. Ils utilisent à la place le formulaire de demande de quota en libre-service et spécifient le type de quota managé par la PTU. Le formulaire est accessible à partir d’un lien à droite de l’élément de quota. La cible doit répondre à toutes les demandes de quota dans les deux jours ouvrables.

La capture d’écran de quota suivante montre un quota indépendant du modèle utilisé par des déploiements de différents types ainsi que le lien pour une demande de quota supplémentaire.

Screenshot de l’interface utilisateur du nouveau type de requête pour Azure OpenAI provisionné pour demander plus de quota.

Quota en tant que limite

Avant la mise à jour d’août, Azure OpenAI Provisioned était disponible uniquement pour quelques clients, et le quota a été alloué pour optimiser la capacité de déploiement et d’utilisation de celui-ci. Grâce à ces modifications, le processus d’acquisition de quota est simplifié pour tous les utilisateurs et il existe une probabilité plus élevée de rencontrer des limitations de capacité de service lorsque des déploiements sont tentés. Une nouvelle API et un nouveau portail sont disponibles pour aider les utilisateurs à trouver les régions dans lesquelles l’abonnement dispose d’un quota, et où le service a la capacité nécessaire pour prendre en charge les déploiements d’un modèle souhaité.

Nous recommandons également aux clients utilisant actuellement des engagements de créer leurs déploiements avant de créer ou d’étendre les engagements destinés à les couvrir. Cette opération veille à ce que la capacité soit disponible avant de créer un engagement et empêche un achat superflu d’engagement. Pour la prendre en charge, la restriction ayant empêché la création de déploiements plus grands que leurs engagements a été supprimée. Cette nouvelle approche des quotas, de la disponibilité de la capacité et des engagements correspond à ce qui est fourni dans le cadre du modèle horaire/réservation. Les conseils d’aide au déploiement avant l’achat d’un engagement (ou d’une réservation, pour le modèle horaire) sont les mêmes pour les deux modèles.

Pour plus d’informations, consultez les liens suivants. L’aide en matière de réservations et d’engagements est la même :

Nouveau modèle de paiement de la réservation horaire

Note

La description suivante des modèles de paiement ne s’applique pas à l’ancienne offre « Approvisionné classique (PTU-C) ». Ils affectent uniquement l’offre Approvisionné (également appelée Approvisionné managé). La gestion de l’option Approvisionné classique par le modèle de paiement d’abonnement mensuel se poursuit.

Microsoft a lancé un nouveau modèle de paiement « Horaire/réservation » pour les déploiements approvisionnés. Cela s’ajoute au modèle de paiement d’engagement actuel, qui continuera d’être pris en charge jusqu’à la fin de la durée de vie de la liste des modèles limités actuellement pris en charge. Reportez-vous aux modèles pris en charge sur le modèle de paiement d’engagement pour la liste des modèles pris en charge sur le modèle de paiement d’engagement. Vous avez également la possibilité d’acheter des Réservations Azure pour bénéficier de remises supplémentaires.

Nouvelles réservations de Azure pour les déploiements provisionnés dans des zones de données et globales

Outre les mises à jour du modèle de paiement horaire, en décembre 2024, les nouvelles Reservations Azure ont été introduites spécifiquement pour les déploiements provisionnés à l'échelle mondiale et dans les zones de données. Avec ces nouvelles réservations Azure, chaque type de déploiement approvisionné aura une réservation Azure distincte qui peut être achetée pour bénéficier de remises supplémentaires. Le mappage entre chaque type de déploiement approvisionné et la Azure Réservation associée sont les suivants :

Type de déploiement approvisionné Nom de référence SKU dans le code nom du produit de réservation Azure
Approvisionné global GlobalProvisionedManaged Global géré approvisionné
Approvisionné dans les zones de données DataZoneProvisionedManaged Zone de données géré approvisionné
provisionné ProvisionedManaged Régional géré approvisionné

Important

Les réservations Azure pour les offres Azure OpenAI approvisionnées ne sont pas interchangeables d'un type de déploiement à un autre. La réservation Azure achetée doit correspondre au type de déploiement provisionné. Si la réservation Azure achetée ne correspond pas au type de déploiement provisionné, le déploiement provisionné est défini par défaut sur le modèle de paiement horaire jusqu’à ce qu’un produit de réservation correspondant Azure soit acheté. Pour plus d'informations, consultez les Réservations Azure pour Azure OpenAI dans les Modèles Foundry provisionnés.

Modèle de paiement d’engagement

  • Un abonnement mensuel régional est requis pour utiliser l’option Approvisionné (des termes plus longs sont disponibles par voie contractuelle).

  • Les engagements sont liés aux ressources Azure OpenAI, ce qui rend le déplacement des déploiements entre les ressources difficile.

  • Les engagements ne peuvent pas être annulés ou modifiés pendant leur terme, excepté pour ajouter de nouvelles PTU.

Modèles pris en charge sur le modèle de paiement d’engagement :

Seule la liste suivante des modèles Azure OpenAI est prise en charge dans l'engagement. Pour intégrer d'autres modèles qui ne figurent pas dans la liste ci-dessous, ou des modèles plus récents offerts avec un débit provisionné, veuillez consulter le guide d'intégration provisionné Azure OpenAI et Azure Réservations pour les déploiements provisionnés Azure OpenAI.

Modèles pris en charge sur le plan d’engagement Versions
gpt-35-turbo 0125,1106
gpt-4 0613, 1106-Aperçu, 0125-Aperçu
gpt-4-turbo 09-04-2024
gpt-4-32k 0613
gpt-4o 2024-05-13, 2024-08-06
gpt-4o-mini 18/07/2024

Modèle de paiement de la réservation horaire

  • Le modèle de paiement est aligné sur les normes Azure pour d’autres produits.

  • L’utilisation horaire est prise en charge sans engagement.

  • Des remises à terme d’un mois et d’un an peuvent être achetées en tant que réservations régionales Azure.

  • Les réservations peuvent être étendues de manière flexible pour couvrir plusieurs abonnements et l’étendue peut être modifiée à mi-terme.

  • Prend en charge tous les modèles, anciens et nouveaux.

Important

D’autres modèles les plus récents sont disponibles dans l’offre provisionnée avec le modèle de paiement horaire/réservation. Vérifiez la liste ici pour les availabilityModels qui ne figurent pas dans la liste ne sont pas déployables sur les ressources Azure OpenAI qui ont des engagements actifs. Pour déployer des modèles plus récents, vous devez :

  • Créez des déploiements sur les ressources Azure OpenAI sans engagement.
  • Migrer une ressource existante hors de ses engagements.

Infrastructure des modèles de paiement

Avec la publication du modèle de paiement horaire/réservé, les options de paiement sont plus flexibles et le modèle autour des paiements approvisionnés a changé. Lorsque les engagements d’un mois étaient le seul moyen d’achat approvisionné, le modèle était :

  1. Obtenez un quota de PTU auprès de l’équipe de votre compte Microsoft.
  2. « Achetez » un quota à partir d’un engagement sur la ressource dans laquelle vous souhaitez effectuer le déploiement.
  3. Créez des déploiements sur la ressource jusqu’à la limite de l’engagement.

La principale différence entre ce modèle et le nouveau modèle est qu’auparavant la seule façon d’effectuer un paiement approvisionné était par le biais d’une remise sur la durée d’un mois. À présent, vous pouvez déployer et payer les déploiements toutes les heures si vous choisissez et prenez une décision distincte quant à leur remise via either un engagement d’un mois (comme avant) ou une réservation de Azure.

Avec cet insight, la nouvelle façon de réfléchir aux modèles de paiement est :

  1. Obtenez un quota de PTU à l’aide du formulaire libre-service.
  2. Créez des déploiements à l’aide de votre quota.
  3. Si vous le souhaitez, achetez ou étendez un engagement ou une réservation pour appliquer une remise sur la durée de vos déploiements.

Les étapes 1 et 2 sont les mêmes dans tous les cas. La différence est de savoir si un engagement ou une réservation de Azure est utilisé comme véhicule pour fournir la remise. Dans les deux modèles :

  • Il est possible de déployer davantage de PTU que les PTU à prix réduit. (par exemple, la création d’un déploiement à court terme pour essayer un nouveau modèle est activée en effectuant un déploiement sans acheter de remise)

  • La méthode de remise (engagement ou réservation) applique le prix réduit à un nombre fixe de PTU et a une étendue qui définit les déploiements qui sont comptabilisés par rapport à la remise.

    Type de remise Étendues disponibles (dans une région)
    Engagement ressource Azure OpenAI
    Réservation Groupe de ressources, abonnement unique, groupe d’administration (groupe d’abonnements), partagé (tous les abonnements dans un compte de facturation)
  • Le prix réduit est appliqué aux PTU déployées jusqu’au nombre d’unités de PTU à prix réduit dans la remise.

  • Le nombre de PTU déployées qui dépassent les PTU remisées (ou non couvertes par une remise) sera facturé au tarif horaire.

  • La meilleure pratique consiste à créer d’abord des déploiements, puis à appliquer des remises. Cela sert à garantir ce service. la capacité est disponible pour prendre en charge vos déploiements avant la création d’un contrat de terme pour les PTU que vous ne pouvez pas utiliser.

Note

Quand vous suivez les meilleures pratiques, vous pouvez être soumis à des frais horaires entre le moment où vous créez le déploiement et celui où vous augmentez votre remise (engagement ou réservation).

Pour cette raison, nous vous recommandons d’augmenter votre remise immédiatement après le déploiement. Les conditions préalables à l’achat d’une réservation Azure sont différentes des engagements, et nous vous recommandons de les valider avant le déploiement si vous envisagez de les utiliser pour réduire votre déploiement. Pour plus d’informations, consultez Permissions pour afficher et gérer les réservations Azure

Mappage de déploiements à la méthode de remise

Les clients qui utilisent Azure offre provisionnée OpenAI antérieure à août 2024 peuvent utiliser les deux modèles de paiement simultanément dans un abonnement. Le modèle de paiement utilisé pour chaque déploiement est déterminé en fonction de sa ressource Azure OpenAI:

La ressource a un engagement actif

  • L’engagement réduit tous les déploiements sur la ressource jusqu’au nombre de PTU sur l’engagement. Tous les PTU excédentaires sont facturées à chaque heure, sauf si les PTU excédentaires ne sont pas dans l’étendue d’une réservation active. Si les PTU excédentaires se trouvent dans l’étendue d’une réservation active, elles feront l’objet d’une remise en tant que groupe jusqu’au nombre de PTU sur la réservation, et tout dépassement excédentaire restant sera facturé à chaque heure.

La ressource n’a pas d’engagement actif

  • Les déploiements sous la ressource peuvent bénéficier d'une réduction grâce à une réservation d'Azure. Pour que ces déploiements soient réduits, ils doivent se trouver dans l’étendue d’une réservation active. Tous les déploiements dans l’étendue de la réservation (y compris éventuellement les déploiements sur d’autres ressources dans le même abonnement ou d’autres abonnements) seront réduits en tant que groupe jusqu’au nombre de PTU sur la réservation. Tous les PTU excédentaires bénéficieront d’une facturation horaire.

Modifications apportées au mode de paiement existant

Les clients qui ont des engagements aujourd’hui peuvent continuer à les utiliser au moins jusqu’à la mise hors service du modèle pris en charge. Cela inclut l’achat de nouveaux PTU sur des engagements nouveaux ou existants et la gestion des renouvellements d’engagement. Toutefois, la mise à jour d’août a changé certains aspects de l’opération des engagements.

  • Azure OpenAI a cessé de soutenir l’inscription pour de nouveaux engagements, à compter du 1er août 2024

  • Seul un ensemble limité de modèles peut être déployé sur une ressource avec un engagement. Voici la liste des modèles

  • Si les PTU déployées sous un engagement dépassent les PTU engagées, les frais de dépassement horaires sont émis sur le même compteur horaire utilisé pour le nouveau modèle de paiement horaire/réservation. Cela permet de réduire les frais de dépassement par le biais d’une réservation Azure.

  • Il est possible de déployer plus de PTU que ceux validés sur la ressource. Cela offre la possibilité de garantir la disponibilité de la capacité avant d’augmenter la taille d’engagement pour la couvrir.

Migration de ressources existantes hors engagements

Les clients existants peuvent choisir de migrer leurs ressources existantes du modèle de paiement Engagement au modèle Horaire/Réservation pour bénéficier de la faculté de déployer les derniers modèles, ou de consolider les réductions pour divers déploiements sous une seule réservation, à l'aide d'une approche en libre-service.

Migration en self-service

L’approche de migration en self-service permet à un client d’extraire des ressources de ses engagements de manière organique en leur permettant d’expirer. Le processus de migration d’une ressource est le suivant :

  • Définissez un engagement existant ne faisant pas l’objet d’un renouvellement automatique et notez la date d’expiration.

  • Avant la date d’expiration, un client devrait acheter une réservation Azure couvrant le nombre total de PTUs engagés par abonnement. Si une réservation existante a déjà l’abonnement dans son étendue, elle peut être augmentée en taille pour couvrir les nouvelles PTU.

  • Lorsque l’engagement expire, les déploiements sous la ressource basculent automatiquement vers le mode Horaire/Réservation ayant l’utilisation remisée par la réservation.

L’approche de migration en self-service entraîne un chevauchement où la réservation et l’engagement sont actifs. Il s’agit d’une caractéristique de ce mode de migration. Le temps de réservation ou d’engagement pour ce chevauchement n’est pas remboursé au client.

Une autre approche à la migration en self-service consiste à basculer l’achat de réservation pour qu’il se produise après l’expiration de l’engagement. Dans cette approche, les déploiements génèrent une utilisation horaire pour la période comprise entre l’expiration de l’engagement et l’achat de la réservation. Comme pour le modèle précédent, il s’agit d’une caractéristique de cette approche et cette utilisation horaire n’est pas remboursée.

Avantages de la migration en libre-service :

  • Les ressources individuelles peuvent être migrées à différents moments.
  • Les clients gèrent la migration sans aucune dépendance sur Microsoft.

Inconvénients de la migration en libre-service :

  • Il existe une courte période de double facturation ou de frais horaires pendant le basculement de la facturation engagée à la facturation horaire/réservation.

Important

L’approche en libre-service génère des frais supplémentaires, car le mode de paiement est passé du mode de paiement validé à l’heure/réservation. Il s’agit des caractéristiques de cette approche de migration et les clients ne sont pas crédités pour ces frais.

Migration de déploiements existants vers des déploiements approvisionnés dans les zones de données ou globaux

Les clients existants des déploiements approvisionnés peuvent choisir de migrer vers des déploiements approvisionnés dans les zones de données ou globaux pour bénéficier de minimums de déploiement inférieurs, d’incréments d’échelle granulaires ou de la tarification différenciée disponible pour ces types de déploiement. Pour en savoir plus sur la façon dont les déploiements dans les zones de données mondiales et régionales gèrent le traitement des données à travers les zones géographiques Azure, consultez la documentation sur le traitement des données du déploiement Azure OpenAI .

Deux approches sont disponibles pour permettre aux clients de migrer des déploiements approvisionnés vers des déploiements approvisionnés dans les zones de données ou globaux.

Migration sans interruption de service

L’approche de migration sans temps d’arrêt permet aux clients de migrer leurs déploiements approvisionnés existants vers des déploiements approvisionnés dans les zones de données ou globaux sans interrompre le trafic d’inférence existant sur leur déploiement. Cette approche de migration réduit les interruptions des charges de travail, mais nécessite qu’un client dispose de plusieurs déploiements coexistants lors du déplacement du trafic. Le processus de migration d’un déploiement approvisionné à l’aide de l’approche de migration sans temps d’arrêt est le suivant :

  • Créez un nouveau déploiement en utilisant les types de déploiement provisionnés dans la zone globale ou la zone de données de la ressource Azure OpenAI cible.
  • Transférez le trafic du déploiement approvisionné régional existant vers le déploiement approvisionné sur les zones de données ou global nouvellement créé jusqu’à ce que tout le trafic soit déchargé du déploiement approvisionné régional existant.
  • Une fois le trafic migré vers le nouveau déploiement, vérifiez qu’aucune demande d’inférence n’est traitée sur le déploiement provisionné précédent en veillant à ce que la métrique Azure demandes OpenAI n’affiche aucun appel d’API effectué dans les 5 à 10 minutes suivant la migration du trafic d’inférence vers le nouveau déploiement. Pour plus d’informations sur cette métrique, consultez la documentation Monitor Azure OpenAI.
  • Une fois que vous confirmez qu’aucun appel d’inférence n’a été effectué, supprimez le déploiement approvisionné régional.

Migration avec temps d’arrêt

La migration avec temps d’arrêt implique la migration de déploiements approvisionnés existants vers des déploiements approvisionnés dans les zones de données ou globaux tout en arrêtant tout trafic d’inférence existant sur le déploiement approvisionné d’origine. Cette approche de migration ne nécessite pas la coexistence de plusieurs déploiements, mais nécessite une interruption des charges de travail. Le processus de migration d’un déploiement approvisionné à l’aide de la migration avec temps d’arrêt est le suivant :

  • Vérifiez qu’aucune demande d’inférence n’est traitée sur le déploiement provisionné précédent en veillant à ce que la métrique Azure demandes OpenAI n’affiche aucun appel d’API effectué au cours des 5 à 10 dernières minutes. Pour plus d’informations sur cette métrique, consultez la documentation Monitor Azure OpenAI.
  • Une fois que vous confirmez qu’aucun appel d’inférence n’a été effectué, supprimez le déploiement approvisionné régional.
  • Créez un nouveau déploiement en utilisant les types de déploiement globaux ou de zone de données dans la ressource Azure OpenAI cible.
  • Une fois votre nouveau déploiement réussi, vous pouvez reprendre le trafic d’inférence sur le nouveau déploiement global ou de zone de données.

Comment migrer ma réservation Azure existante vers les nouveaux produits de réservation d'Azure ?

Les réservations Azure pour les offres Azure OpenAI approvisionnées sont spécifiques au type de déploiement approvisionné. Si la réservation Azure achetée ne correspond pas au type de déploiement provisionné, le déploiement est défini par défaut sur le modèle de paiement horaire. Si vous choisissez de migrer vers des déploiements provisionnés dans des zones de données ou globales, vous devrez peut-être acheter une nouvelle réservation de Azure pour ces déploiements afin de prendre en charge des remises supplémentaires. Pour plus d’informations sur la façon d’acheter une nouvelle réservation Azure ou d’apporter des modifications à une réservation Azure existante, consultez le guide Azure Reservations pour Azure OpenAI Provisioned.

Gestion des engagements de débit approvisionnés

Les engagements de débit provisionnés sont créés et gérés en sélectionnant Centre de gestion dans le portail Foundry, le menu de navigation >Quota>Gérer les engagements.

Capture d’écran de l’interface utilisateur d’achat d’engagement avec des notifications.

Dans la vue Gérer les engagements , vous pouvez effectuer plusieurs opérations :

  • Acheter de nouveaux engagements ou modifiez les engagements existants.
  • Superviser tous les engagements dans votre abonnement.
  • Identifier et prendre des mesures sur les engagements susceptibles de provoquer une facturation inattendue.

Les sections suivantes vous aideront à effectuer ces tâches.

Achat d’un engagement de débit approvisionné

Avec votre plan d’engagement prêt, l’étape suivante consiste à créer les engagements. Les engagements sont créés manuellement via Foundry et nécessitent que l'utilisateur qui crée l'engagement ait soit le rôle de Contributor, soit celui de Contributeur Cognitive Services au niveau de l'abonnement.

Pour chaque nouvel engagement que vous devez créer, procédez comme suit :

  1. Lancez la boîte de dialogue Achat de débit approvisionné en sélectionnant Quota>Azure OpenAI Provisioned>Manage Commitment plans.

Capture d’écran de la boîte de dialogue Achat.

  1. Sélectionnez Engagement d’achat.

  2. Sélectionnez la Azure ressource OpenAI et achetez l’engagement. Vous verrez vos ressources divisées en ressources avec des engagements existants, que vous pouvez modifier et les ressources qui n’ont pas actuellement d’engagement.

Réglage Remarques
Sélectionner une ressource Choisissez la ressource dans laquelle vous allez créer le déploiement approvisionné. Une fois que vous avez acheté l’engagement, vous ne pourrez pas utiliser les PTU sur une autre ressource jusqu’à l’expiration de l’engagement actuel.
Sélectionner un type d’engagement Sélectionnez Approvisionné. (Approvisionné équivaut à Approvisionné managé)
Quota approvisionné non engagé actuel Nombre de PTU actuellement disponibles pour vous permettre de valider cette ressource.
Montant à engager (PTU) Choisissez le nombre de PTU que vous engagez. Ce nombre peut être augmenté pendant la période d’engagement, mais ne peut pas être diminué. Entrez les valeurs par incréments de 50 pour le type d’engagement Approvisionné.
Niveau d’engagement pour la période actuelle La période d’engagement est définie sur un mois.
Paramètres de renouvellement Renouveler automatiquement aux PTU actuelles
Renouveler automatiquement à des PTU inférieures
Ne pas renouveler automatiquement
  1. Sélectionnez Acheter. Une boîte de dialogue de confirmation s’affiche. Une fois que vous avez confirmé, vos PTU sont validées et vous pouvez les utiliser pour créer un déploiement approvisionné. |

Capture d’écran de l’interface utilisateur d’achat d’engagement.

Important

Un nouvel engagement est facturé à l’avance pour toute la durée. Si les paramètres de renouvellement sont définis sur renouvellement automatique, vous serez facturé à nouveau à chaque date de renouvellement en fonction des paramètres de renouvellement.

Modifier un engagement de débit approvisionné existant

Dans la vue Gérer les engagements , vous pouvez également modifier un engagement existant. Il existe deux types de modifications que vous pouvez apporter à un engagement existant :

  • Vous pouvez ajouter des PTU à l’engagement.
  • Vous pouvez modifier les paramètres de renouvellement.

Pour modifier un engagement, sélectionnez-le, puis sélectionnez Modifier l’engagement.

Ajout d’unités de débit approvisionnées à des engagements existants

L’ajout de PTU à un engagement existant vous permet de créer des déploiements plus volumineux ou plus nombreux au sein de la ressource. Vous pouvez le faire à tout moment pendant la durée de votre engagement.

Capture d’écran de l’interface utilisateur d’achat d’engagement avec une augmentation du montant de la valeur d’engagement.

Important

Lorsque vous ajoutez des PTU à un engagement, elles seront facturées immédiatement, à un montant calculé au prorata de la date actuelle jusqu’à la fin de la période d’engagement existante. L’ajout de PTU ne réinitialise pas la durée de l’engagement.

Modification des paramètres de renouvellement

Vous pouvez modifier les paramètres de renouvellement de l’engagement à tout moment avant la date d’expiration de votre engagement. Les raisons pour lesquelles vous souhaiterez peut-être modifier les paramètres de renouvellement incluent la fin de votre utilisation du débit approvisionné en définissant l’engagement sur ne pas renouveler automatiquement, ou la réduction de l’utilisation du débit approvisionné en réduisant le nombre de PTU qui seront validées au cours de la prochaine période.

Important

Si vous autorisez un engagement à expirer ou à diminuer la taille de telle sorte que les déploiements sous la ressource nécessitent plus de PTU que vous n’en avez dans votre engagement de ressource, vous recevrez des frais de dépassement horaires pour tout dépassement horaire des PTU excédentaires. Par exemple, une ressource qui a des déploiements qui totalisent 500 PTU et un engagement pour 300 PTU généreront des frais de dépassement horaire pour 200 PTU.

Superviser les engagements et empêcher les facturations inattendues

La section Manage Commitments fournit une vue d’ensemble de toutes les ressources avec des engagements et une utilisation PTU dans un abonnement Azure donné. D’une importance particulière sont les suivantes :

  • PTUs engagés, déployés et utilisés : ces chiffres fournissent les tailles de vos engagements et les quantités utilisées par les déploiements. Optimisez votre investissement en utilisant l’ensemble de vos PTU validées.
  • Stratégie d’expiration et date : la date d’expiration et la stratégie vous indiquent quand un engagement expire et ce qui se passe quand il le fait. Un engagement défini pour le renouvellement automatique génère un événement de facturation à la date de renouvellement. Pour les engagements arrivant à expiration, veillez à supprimer les déploiements de ces ressources avant la date d’expiration pour empêcher la facturation de dépassement horaire. Les paramètres de renouvellement actuels d’un engagement.
  • Notifications : alertes concernant des conditions importantes telles que les engagements inutilisés et les configurations susceptibles d’entraîner des dépassements de facturation. Les dépassements de facturation peuvent être causés par des situations telles que le moment où un engagement a expiré et que les déploiements sont toujours présents, mais qu’ils sont passés à la facturation horaire.

Important

Si vous définissez un engagement pour renouveler automatiquement la date de renouvellement sera la même date le mois prochain. Si la date n’existe pas, la date de renouvellement sera de fin de mois. Exemples –
Scénario 1 : Si vous achetez un engagement le 21 février et que vous définissez l’engagement sur le renouvellement automatique, la prochaine date de renouvellement de l’engagement sera le 21 mars.

Scénario 2 : Si vous achetez l’engagement le 31 mai et que vous définissez l’engagement sur le renouvellement automatique, la prochaine date de renouvellement de l’engagement sera le 30 juin (fin du mois) car il n’y a pas de 31e au mois de juin.

Scénario 3 : Si vous achetez l’engagement le 31 janvier et que vous définissez l’engagement sur le renouvellement automatique, la prochaine date de renouvellement de l’engagement sera le 28 février (fin du mois) car il n’y a pas de 31e ou 30e ou 29e (en années non bissextiles) et la date de renouvellement sera le 29 février (en une année bissextile) au mois de février.

Scénarios courants de gestion des engagements

Arrêt de l’utilisation du débit provisionné

Pour mettre fin à l’utilisation du débit approvisionné et empêcher les frais de dépassement horaire après l’expiration de l’engagement, arrêtez les frais après l’expiration des engagements actuels. Vous devez effectuer deux étapes :

  1. Définissez la politique de renouvellement de tous les engagements sur Ne pas renouveler automatiquement.
  2. Supprimez les déploiements approvisionnés à l’aide du quota.

Important

Si vous laissez un engagement expirer avec l'intention d'interrompre le débit alloué et sans supprimer les déploiements provisionnés, vous recevrez des frais de dépassement horaire pour toutes les unités de débit encore présentes dans le déploiement. Par exemple, une ressource qui a des déploiements totalisant 500 PTU et pour laquelle un engagement a été sélectionné pour ne pas renouveler automatiquement entraînera des frais horaires après l'expiration de l'engagement jusqu'à ce que le déploiement soit supprimé. Il n’existe aucune option disponible aujourd’hui qui supprime automatiquement le déploiement, il doit être supprimé manuellement lorsque vous décidez d’interrompre l’utilisation du débit provisionné.

Déplacer un engagement/déploiement vers une nouvelle ressource dans le même abonnement/région

Il n’est pas possible dans Foundry de déplacer directement un déploiement ou un engagement vers une nouvelle ressource. Au lieu de cela, un nouveau déploiement doit être créé sur la ressource cible et le trafic déplacé vers celui-ci. Pour ce faire, un engagement acheté devra être établi sur la nouvelle ressource. Étant donné que les engagements sont facturés à l’avance pour une période de 30 jours, il est nécessaire d’effectuer ce déplacement avec l’expiration de l’engagement d’origine afin de réduire le chevauchement avec le nouvel engagement et la « double facturation » pendant le chevauchement.

Il existe deux approches pour effectuer cette transition.

Option 1 : Basculement sans chevauchement

Cette option nécessite un temps d’arrêt, mais ne nécessite aucun quota supplémentaire et ne génère aucun coût supplémentaire.

Étapes Remarques
Définissez la stratégie de renouvellement pour que l’engagement existant expire Cela empêchera l’engagement d’être renouveler et de générer d’autres frais
Avant l’expiration de l’engagement existant, supprimez son déploiement Le temps d’arrêt commence à ce stade et durera jusqu’à ce que le nouveau déploiement soit créé et que le trafic soit déplacé. Vous réduirez la durée en programmant la suppression le plus près possible de la date/heure d’expiration.
Après l’expiration de l’engagement existant, créez l’engagement sur la nouvelle ressource Réduisez le temps d’arrêt en effectuant cette étape et l’étape suivante dès que possible après expiration.
Créez le déploiement sur la nouvelle ressource et déplacez le trafic vers celui-ci

Option 2 : Basculement avec chevauchement

Cette option permet d’éviter les temps d’arrêt grâce à la mise en service simultanée du déploiement existant et du nouveau déploiement. Cela nécessite de disposer d’un quota pour créer le nouveau déploiement et génère des coûts supplémentaires pour la durée des déploiements qui se chevauchent.

Étapes Remarques
Définissez la stratégie de renouvellement pour que l’engagement existant expire Cela empêche l’engagement d’être renouveler et de générer d’autres frais.
Avant l’expiration de l’engagement existant :
1. Créez l’engagement sur la nouvelle ressource.
2. Créez le nouveau déploiement.
3. Basculez le trafic.
4. Supprimez le déploiement existant.
Veillez à laisser suffisamment de temps pour toutes les étapes avant l’expiration de l’engagement existant, sinon les frais de dépassement seront générés (voir la section suivante) pour les options.

Si la dernière étape prend plus de temps que prévu et se termine après l’expiration de l’engagement existant, il existe trois options pour réduire les frais de dépassement.

  • Prenez un temps d’arrêt : supprimez le déploiement d’origine, puis effectuez le déplacement.
  • Payer le dépassement : conservez le déploiement d’origine et passez à une facturation horaire jusqu’à ce que vous ayez arrêté le trafic et supprimé le déploiement.
  • Réinitialisez l’engagement d’origine pour renouveler une fois de plus. Cela vous donnera le temps d’effectuer le déplacement avec un coût connu.

Le paiement d’un dépassement et la réinitialisation de l’engagement d’origine généreront des frais au-delà de la date d’expiration d’origine. Le paiement de frais de dépassement peut être moins cher qu’un nouvel engagement d’un mois si vous n’avez besoin que d’un jour ou deux pour terminer le déplacement. Comparez les coûts des deux options pour trouver l’approche la moins chère.

Déplacer le déploiement vers une nouvelle région ou un nouvel abonnement

Les mêmes approches s’appliquent au déplacement de l’engagement et du déploiement au sein de la région, sauf que le quota disponible dans le nouvel emplacement sera requis dans tous les cas.

Afficher et modifier une ressource existante

Dans Foundry, sélectionnez centre de gestion>Quota>Provisionné>Gérer les engagements et sélectionnez une ressource avec un engagement existant pour l’afficher ou le modifier.