Événements
Créer des applications intelligentes
17 mars, 21 h - 21 mars, 10 h
Rejoignez la série de rencontres pour créer des solutions IA évolutives basées sur des cas d’usage réels avec d’autres développeurs et experts.
S’inscrire maintenantCe navigateur n’est plus pris en charge.
Effectuez une mise à niveau vers Microsoft Edge pour tirer parti des dernières fonctionnalités, des mises à jour de sécurité et du support technique.
Microsoft a lancé des améliorations apportées à son offre de débit approvisionné qui répond aux commentaires des clients sur la facilité d’utilisation et l’agilité opérationnelle qui ouvrent de nouvelles options de paiement et scénarios de déploiement.
Cet article est destiné aux utilisateurs existants de l’offre de débit approvisionné. Les nouveaux clients devraient consulter le Guide d’intégration d’Azure OpenAI Provisioned.
Important
Les modifications apportées à cet article ne s’appliquent pas à l’ancienne offre « Provisioned Classic (PTU-C) » . Ils affectent uniquement l’offre Approvisionné (également appelée Approvisionné managé).
Fonctionnalité | Avantage |
---|---|
Quota indépendant du modèle | Une limite de quota unique couvrant tous les modèles/toutes les versions réduit l’administration des quotas et accélère l’expérimentation des nouveaux modèles. |
Demandes de quota en libre-service | Demander des augmentations de quota sans contacter l’équipe commerciale, beaucoup peuvent être approuvées automatiquement. |
Quota approvisionné-approuvé par défaut dans de nombreuses régions | Démarrez rapidement sans avoir à demander d’abord un quota. |
Des informations transparentes sur la disponibilité de capacité en temps réel + nouveau flux de déploiement | Une négociation réduite de la disponibilité accélère le délai de commercialisation. |
Fonctionnalité | Avantage |
---|---|
Option Sans liaison, Heure | L’option de paiement horaire sans liaison active les scénarios de déploiement à court terme. Idéal pour tester de nouveaux modèles et évaluer les avantages du débit approvisionné. |
Remises à terme via des réservations Azure | Les réservations Azure offrent des remises importantes sur le taux horaire, pour les termes sur un mois et sur un an, et fournissent des étendues flexibles réduisant l’administration et qui sont associées aux engagements liés à la ressource d’aujourd’hui. |
Quota approvisionné-approuvé par défaut dans de nombreuses régions | Démarrez rapidement dans de nouvelles régions sans avoir à demander d’abord un quota. |
Choix flexible du modèle de paiement pour les clients approvisionnés existants | Les clients ayant des engagements peuvent rester sur le modèle d’engagement jusqu’à la fin de la durée de vie des modèles actuellement pris en charge et choisir de migrer des engagements existants vers des engagements horaires/réservations via un processus géré. Nous vous recommandons de migrer vers des réservations horaires pour tirer parti des remises à terme et utiliser les derniers modèles. |
Prise en charge des dernières générations de modèles | Les modèles les plus récents sont disponibles uniquement sur les réservations horaires/ dans l’offre provisionnée. |
La granularité de quota approvisionnée change du mode spécifique au modèle vers celui indépendant du modèle. Plutôt que chaque modèle et chaque version au sein d’un abonnement et d’une région aient leur propre limite de quota, il existe un élément de quota unique par abonnement et par région qui limite le nombre total de PTU pouvant être déployées sur tous les modèles et toutes les versions pris en charge.
Depuis le 12 août 2024, le quota actuel des clients existants, spécifique au modèle, a été converti en quota indépendant du modèle. Cela se fait automatiquement. Aucun quota n’est perdu lors de la transition. Les limites de quota existantes sont additionnées et affectées à un nouvel élément de quota indépendant du modèle.
Le nouveau quota indépendant du modèle s’affiche en tant qu’élément de quota nommé Unité de débit managée provisionnée, le modèle et la version n’étant plus inclus dans le nom. Dans le volet Quota d’Azure AI Foundry, le développement de l’élément de quota permet toujours d’afficher tous les déploiements qui contribuent à l’élément de quota.
Une petite quantité de quota approvisionné est affectée à des abonnements nouveaux et existants dans plusieurs régions. Cela permet aux clients de commencer à utiliser ces régions sans avoir à demander d’abord un quota.
Pour les clients existants, si la région contient déjà une affectation de quota, la limite de quota n’est pas changée pour la région. Par exemple, elle n’est pas automatiquement augmentée par la nouvelle quantité par défaut.
Les clients n’obtiennent plus un quota en contactant leur équipe commerciale. Ils utilisent à la place le formulaire de demande de quota en libre-service et spécifient le type de quota managé par la PTU. Le formulaire est accessible à partir d’un lien à droite de l’élément de quota. La cible doit répondre à toutes les demandes de quota dans les deux jours ouvrables.
La capture d’écran de quota suivante montre un quota indépendant du modèle utilisé par des déploiements de différents types ainsi que le lien pour une demande de quota supplémentaire.
Avant la mise à jour du mois d’août, Azure OpenAI Provisioned était uniquement à la disposition de quelques utilisateurs et le quota était alloué pour maximiser leur capacité à déployer et à l’utiliser. Grâce à ces modifications, le processus d’acquisition de quota est simplifié pour tous les utilisateurs et il existe une probabilité plus élevée de rencontrer des limitations de capacité de service lorsque des déploiements sont tentés. Une nouvelle API et un nouveau portail sont disponibles pour aider les utilisateurs à trouver les régions dans lesquelles l’abonnement dispose d’un quota, et où le service a la capacité nécessaire pour prendre en charge les déploiements d’un modèle souhaité.
Nous recommandons également aux clients utilisant actuellement des engagements de créer leurs déploiements avant de créer ou d’étendre les engagements destinés à les couvrir. Cette opération veille à ce que la capacité soit disponible avant de créer un engagement et empêche un achat superflu d’engagement. Pour la prendre en charge, la restriction ayant empêché la création de déploiements plus grands que leurs engagements a été supprimée. Cette nouvelle approche des quotas, de la disponibilité de la capacité et des engagements correspond à ce qui est fourni dans le cadre du modèle horaire/réservation. Les conseils d’aide au déploiement avant l’achat d’un engagement (ou d’une réservation, pour le modèle horaire) sont les mêmes pour les deux modèles.
Pour plus d'informations, consultez les liens suivants. L’aide en matière de réservations et d’engagements est la même :
Notes
La description suivante des modèles de paiement ne s’applique pas à l’ancienne offre « Approvisionné classique (PTU-C) ». Ils affectent uniquement l’offre Approvisionné (également appelée Approvisionné managé). La gestion de l’option Approvisionné classique par le modèle de paiement d’abonnement mensuel se poursuit.
Microsoft a lancé un nouveau modèle de paiement « Horaire/réservation » pour les déploiements approvisionnés. Cela s’ajoute au modèle de paiement actuel Engagement , qui continuera d’être pris en charge jusqu’à la fin de la durée de vie de la liste des modèles limités actuellement pris en charge. Reportez-vous aux modèles pris en charge sur modèle de paiement d’engagement pour obtenir la liste des modèles pris en charge sur le modèle de paiement d’engagement.
Un abonnement mensuel régional est requis pour utiliser l’option Approvisionné (des termes plus longs sont disponibles par voie contractuelle).
Les engagements sont liés aux ressources Azure OpenAI, ce qui rend difficile le déplacement des déploiements entre les ressources.
Les engagements ne peuvent pas être annulés ou modifiés pendant leur terme, excepté pour ajouter de nouvelles PTU.
Seules la liste suivante des modèles Azure OpenAI est prise en charge dans Les engagements. Pour intégrer d’autres modèles qui ne figurent pas dans la liste ci-dessous, ou pour les modèles plus récents sur l’offre de débit approvisionné, reportez-vous au guide d’intégration provisionné Azure OpenAI et réservations Azure pour les déploiements provisionnés Azure OpenAI
Modèles pris en charge sur le plan d’engagement |
---|
gpt-35-turbo |
gpt-4 |
gpt-4-32k |
gpt-4o |
Le modèle de paiement s’aligne sur les normes Azure d’autres produits.
L’utilisation horaire est prise en charge sans engagement.
Des remises sur les termes d’un mois et d’un an peuvent être acquises comme réservations Azure régionales.
Les réservations peuvent être étendues de manière flexible pour couvrir plusieurs abonnements et l’étendue peut être modifiée à mi-terme.
Prend en charge tous les modèles, anciens et nouveaux.
Important
D’autres modèles les plus récents sont disponibles dans l’offre provisionnée avec le modèle de paiement horaire/réservation. Consultez la liste ici pour les availabilityModels qui ne figurent pas dans la liste ci-dessus ne sont pas déployables sur les ressources Azure OpenAI qui ont des engagements actifs. Pour déployer des modèles plus récents, vous devez :
Avec la publication du modèle de paiement horaire/réservé, les options de paiement sont plus flexibles et le modèle autour des paiements approvisionnés a changé. Lorsque les engagements d’un mois étaient le seul moyen d’achat approvisionné, le modèle était :
La principale différence entre ce modèle et le nouveau modèle est qu’auparavant la seule façon d’effectuer un paiement approvisionné était par le biais d’une remise sur la durée d’un mois. À présent, vous pouvez déployer et effectuer un paiement horaire des déploiements si vous le souhaitez et prendre une décision distincte quant à leur remise par le biais soit d’un engagement d’un mois (comme avant), soit d’une réservation Azure.
Avec cette idée, la nouvelle façon de réfléchir aux modèles de paiement est la suivante :
Les étapes 1 et 2 sont les mêmes dans tous les cas. La différence est de savoir si un engagement ou une réservation Azure est utilisé comme véhicule pour fournir la remise. Dans les deux modèles :
Il est possible de déployer davantage de PTU que les PTU à prix réduit. (par exemple, la création d’un déploiement à court terme pour essayer un nouveau modèle est activée en effectuant un déploiement sans acheter de remise)
La méthode de remise (engagement ou réservation) applique le prix réduit à un nombre fixe de PTU et a une étendue qui définit les déploiements qui sont comptabilisés par rapport à la remise.
Type de remise | Étendues disponibles (dans une région) |
---|---|
Avec engagement | Ressource Azure OpenAI |
Réservation | Groupe de ressources, abonnement unique, groupe d’administration (groupe d’abonnements), partagé (tous les abonnements dans un compte de facturation) |
Le prix réduit est appliqué aux PTU déployées jusqu’au nombre d’unités de PTU à prix réduit dans la remise.
Les PTU déployées en plus des PTU à prix réduit (ou non couvertes par une remise) sont facturées au tarif horaire.
La meilleure pratique consiste à créer d’abord des déploiements, puis à appliquer des remises. Cela sert à garantir ce service. la capacité est disponible pour prendre en charge vos déploiements avant la création d’un contrat de terme pour les PTU que vous ne pouvez pas utiliser.
Notes
Quand vous suivez les meilleures pratiques, vous pouvez être soumis à des frais horaires entre le moment où vous créez le déploiement et celui où vous augmentez votre remise (engagement ou réservation).
Pour cette raison, nous vous recommandons d’augmenter votre remise immédiatement après le déploiement. Les conditions préalables à l’achat d’une réservation Azure sont différentes des engagements, et nous vous recommandons de les valider avant le déploiement si vous envisagez de les utiliser pour obtenir une remise sur votre déploiement. Pour plus d’informations, consultez Autorisations pour afficher et gérer les réservations Azure
Les clients qui utilisent l’offre provisionnée Azure OpenAI avant août 2024 peuvent utiliser simultanément des modèles de paiement au sein d’un abonnement. Le modèle de paiement utilisé pour chaque déploiement est déterminé en fonction de sa ressource Azure OpenAI :
La ressource a un engagement actif
La ressource n’a pas d’engagement actif
Les clients qui ont des engagements aujourd’hui peuvent continuer à les utiliser au moins jusqu’à la mise hors service du modèle pris en charge. Cela inclut l’achat de nouveaux PTU sur des engagements nouveaux ou existants et la gestion des renouvellements d’engagement. Toutefois, la mise à jour d’août a changé certains aspects de l’opération des engagements.
Azure OpenAI a cessé de prendre en charge l’inscription sur les nouveaux engagements, à compter du 1er août 2024
Seul un ensemble limité de modèles peut être déployé sur une ressource avec un engagement. Voici la liste des modèles
Si les PTU déployées selon un engagement dépassent les PTU engagées, les frais de dépassement horaires sont émis sur le même compteur horaire utilisé pour le modèle de paiement horaire/réservation. Cela permet aux frais de dépassement d’être remisés via une réservation Azure.
Il est possible de déployer plus de PTU que ceux validés sur la ressource. Cela offre la possibilité de garantir la disponibilité de la capacité avant d’augmenter la taille d’engagement pour la couvrir.
Les clients existants peuvent choisir de migrer leurs ressources existantes du modèle Engagement vers le modèle Horaire/Réservation pour profiter de la possibilité de déployer les modèles les plus récents, ou pour consolider la remise pour divers déploiements sous une réservation unique.
Deux approches sont disponibles pour les clients afin de migrer des ressources utilisant le modèle Engagement vers le modèle Horaire/Réservation.
L’approche de migration en self-service permet à un client d’extraire des ressources de ses engagements de manière organique en leur permettant d’expirer. Le processus de migration d’une ressource est le suivant :
Définissez un engagement existant ne faisant pas l’objet d’un renouvellement automatique et notez la date d’expiration.
Avant la date d’expiration, un client doit acheter une réservation Azure couvrant le nombre total de PTU engagées par abonnement. Si une réservation existante a déjà l’abonnement dans son étendue, elle peut être augmentée en taille pour couvrir les nouvelles PTU.
Lorsque l’engagement expire, les déploiements sous la ressource basculent automatiquement vers le mode Horaire/Réservation ayant l’utilisation remisée par la réservation.
L’approche de migration en self-service entraîne un chevauchement où la réservation et l’engagement sont actifs. Il s’agit d’une caractéristique de ce mode de migration. Le temps de réservation ou d’engagement pour ce chevauchement n’est pas remboursé au client.
Une autre approche à la migration en self-service consiste à basculer l’achat de réservation pour qu’il se produise après l’expiration de l’engagement. Dans cette approche, les déploiements génèrent une utilisation horaire pour la période comprise entre l’expiration de l’engagement et l’achat de la réservation. Comme pour le modèle précédent, il s’agit d’une caractéristique de cette approche et cette utilisation horaire n’est pas remboursée.
Avantages de la migration en self-service :
Inconvénients de la migration en self-service :
Important
L’approche en libre-service génère des frais supplémentaires, car le mode de paiement est passé du mode de paiement validé à l’heure/réservation. Il s’agit des caractéristiques de cette approche de migration et les clients ne sont pas crédités pour ces frais. Vous pouvez également choisir d’utiliser l’approche de migration managée décrite ci-dessous pour éviter des frais supplémentaires.
L’approche de migration managée implique le partenariat du client avec Microsoft pour migrer en bloc tous les engagements de PTU d’un abonnement/d’une région en même temps. Il fonctionne comme ceci :
Les clients doivent contacter les équipes en charge de leur compte pour planifier une migration managée.
Avantages de la migration managée :
Inconvénients de la migration managée :
Vous créez et gérez les engagements de débit provisionné en sélectionnant Centre de gestion dans le menu de navigation du portail Azure AI Foundry, >Quota>Gérer les engagements.
Dans la vue Gérer les engagements, vous pouvez effectuer plusieurs opérations :
Les sections suivantes vous aideront à effectuer ces tâches.
Avec votre plan d’engagement prêt, l’étape suivante consiste à créer les engagements. Vous créez les engagements manuellement via Azure AI Foundry. L’utilisateur qui crée l’engagement doit avoir le rôle Contributeur ou Contributeur Cognitive Services au niveau de l’abonnement.
Pour chaque nouvel engagement que vous devez créer, procédez comme suit :
Sélectionnez Acheter un engagement.
Sélectionnez la ressource Azure OpenAI et achetez l’engagement. Vous verrez vos ressources divisées en ressources avec des engagements existants, que vous pouvez modifier et les ressources qui n’ont pas actuellement d’engagement.
Setting | Notes |
---|---|
Sélectionner une ressource | Choisissez la ressource dans laquelle vous allez créer le déploiement approvisionné. Une fois que vous avez acheté l’engagement, vous ne pourrez pas utiliser les PTU sur une autre ressource jusqu’à l’expiration de l’engagement actuel. |
Sélectionner un type d’engagement | Sélectionnez Provisionné. (Approvisionné équivaut à Approvisionné managé) |
Quota approvisionné non validé actuel | Nombre de PTU actuellement disponibles pour vous permettre de valider cette ressource. |
Montant à valider (PTU) | Choisissez le nombre de PTU que vous engagez. Vous pouvez augmenter ce nombre pendant la période d’engagement, mais pas le diminuer. Entrez les valeurs par incréments de 50 pour le type d’engagement Approvisionné. |
Niveau d’engagement pour la période actuelle | La période d’engagement est définie sur un mois. |
Paramètres de renouvellement | Renouveler automatiquement aux PTU actuelles Renouveler automatiquement à des PTU inférieures Ne pas renouveler automatiquement |
Important
Un nouvel engagement est facturé à l’avance pour toute la durée. Si les paramètres de renouvellement sont définis sur renouvellement automatique, vous serez facturé à nouveau à chaque date de renouvellement en fonction des paramètres de renouvellement.
Dans la vue Gérer les engagements, vous pouvez également modifier un engagement existant. Il existe deux types de modifications que vous pouvez apporter à un engagement existant :
Pour modifier un engagement, sélectionnez-le, puis sélectionnez Modifier l’engagement.
L’ajout de PTU à un engagement existant vous permet de créer des déploiements plus volumineux ou plus nombreux au sein de la ressource. Vous pouvez le faire à tout moment pendant la durée de votre engagement.
Important
Lorsque vous ajoutez des PTU à un engagement, elles seront facturées immédiatement, à un montant calculé au prorata de la date actuelle jusqu’à la fin de la période d’engagement existante. L’ajout de PTU ne réinitialise pas la durée de l’engagement.
Vous pouvez modifier les paramètres de renouvellement de l’engagement à tout moment avant la date d’expiration de votre engagement. Les raisons pour lesquelles vous souhaiterez peut-être modifier les paramètres de renouvellement incluent la fin de votre utilisation du débit approvisionné en définissant l’engagement sur ne pas renouveler automatiquement, ou la réduction de l’utilisation du débit approvisionné en réduisant le nombre de PTU qui seront validées au cours de la prochaine période.
Important
Si vous autorisez un engagement à expirer ou à diminuer la taille de telle sorte que les déploiements sous la ressource nécessitent plus de PTU que vous n’en avez dans votre engagement de ressource, vous recevrez des frais de dépassement horaires pour tout dépassement horaire des PTU excédentaires. Par exemple, une ressource qui a des déploiements qui totalisent 500 PTU et un engagement pour 300 PTU généreront des frais de dépassement horaire pour 200 PTU.
Le volet Gérer les engagements fournit une vue d’ensemble de l’abonnement de toutes les ressources avec les engagements et l’utilisation de PTU dans un abonnement Azure donné. D’une importance particulière sont les suivantes :
Arrêt de l’utilisation du débit approvisionné
Pour mettre fin à l’utilisation du débit approvisionné et empêcher les frais de dépassement horaire après l’expiration de l’engagement, arrêtez les frais après l’expiration des engagements actuels. Vous devez effectuer deux étapes :
Déplacer un engagement/déploiement vers une nouvelle ressource dans le même abonnement/région
Il n’est pas possible dans Azure AI Foundry de déplacer directement un déploiement ou un engagement vers une nouvelle ressource. Au lieu de cela, un nouveau déploiement doit être créé sur la ressource cible et le trafic déplacé vers celui-ci. Pour ce faire, un engagement acheté devra être établi sur la nouvelle ressource. Étant donné que les engagements sont facturés à l’avance pour une période de 30 jours, il est nécessaire d’effectuer ce déplacement avec l’expiration de l’engagement d’origine afin de réduire le chevauchement avec le nouvel engagement et la « double facturation » pendant le chevauchement.
Il existe deux approches pour effectuer cette transition.
Option 1 : basculement sans chevauchement
Cette option nécessite un temps d’arrêt, mais ne nécessite aucun quota supplémentaire et ne génère aucun coût supplémentaire.
Étapes | Notes |
---|---|
Définissez la stratégie de renouvellement pour que l’engagement existant expire | Cela empêchera l’engagement d’être renouveler et de générer d’autres frais |
Avant l’expiration de l’engagement existant, supprimez son déploiement | Le temps d’arrêt commence à ce stade et durera jusqu’à ce que le nouveau déploiement soit créé et que le trafic soit déplacé. Vous réduirez la durée en programmant la suppression le plus près possible de la date/heure d’expiration. |
Après l’expiration de l’engagement existant, créez l’engagement sur la nouvelle ressource | Réduisez le temps d’arrêt en effectuant cette étape et l’étape suivante dès que possible après expiration. |
Créez le déploiement sur la nouvelle ressource et déplacez le trafic vers celui-ci |
Option 2 : basculement superposé
Cette option permet d’éviter les temps d’arrêt grâce à la mise en service simultanée du déploiement existant et du nouveau déploiement. Cela nécessite de disposer d’un quota pour créer le nouveau déploiement et génère des coûts supplémentaires pour la durée des déploiements qui se chevauchent.
Étapes | Notes |
---|---|
Définissez la stratégie de renouvellement pour que l’engagement existant expire | Cela empêche l’engagement d’être renouveler et de générer d’autres frais. |
Avant l’expiration de l’engagement existant : 1. Créez l’engagement sur la nouvelle ressource. 2. Créez le nouveau déploiement. 3. Basculez le trafic 4. Supprimez le déploiement existant |
Veillez à laisser suffisamment de temps pour toutes les étapes avant l’expiration de l’engagement existant, sinon les frais de dépassement seront générés (voir la section suivante) pour les options. |
Si la dernière étape prend plus de temps que prévu et se termine après l’expiration de l’engagement existant, il existe trois options pour réduire les frais de dépassement.
Le paiement d’un dépassement et la réinitialisation de l’engagement d’origine généreront des frais au-delà de la date d’expiration d’origine. Le paiement de frais de dépassement peut être moins cher qu’un nouvel engagement d’un mois si vous n’avez besoin que d’un jour ou deux pour terminer le déplacement. Comparez les coûts des deux options pour trouver l’approche la moins chère.
Les mêmes approches s’appliquent au déplacement de l’engagement et du déploiement au sein de la région, sauf que le quota disponible dans le nouvel emplacement sera requis dans tous les cas.
Dans Azure AI Foundry, sélectionnez Centre de gestion>Quota>Approvisionné>Gérer les engagements, puis sélectionnez une ressource avec un engagement existant pour l’afficher/la changer.
Événements
Créer des applications intelligentes
17 mars, 21 h - 21 mars, 10 h
Rejoignez la série de rencontres pour créer des solutions IA évolutives basées sur des cas d’usage réels avec d’autres développeurs et experts.
S’inscrire maintenantEntrainement
Module
Ce module présente les déploiements approvisionnés dans les services Azure OpenAI.