Remarque
L’accès à cette page requiert une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page requiert une autorisation. Vous pouvez essayer de modifier des répertoires.
Azure OpenAI dans Microsoft Foundry Models est alimenté par un ensemble diversifié de modèles avec différentes fonctionnalités et points de prix. La disponibilité des modèles varie selon les régions.
Vous pouvez obtenir la liste des modèles disponibles pour l’inférence et l’optimisation par votre ressource Azure OpenAI en utilisant l’API Liste de modèles.
Cet article vous montre comment :
- Configurez les mises à jour automatiques du modèle.
- Affichez et mettez à jour la stratégie de mise à niveau de version d’un déploiement.
- Mettez à jour une version de modèle déployée à l’aide de l’API Azure Resource Manager.
- Migrez les déploiements provisionnés vers une autre version ou famille de modèles.
Conditions préalables
- Un abonnement Azure avec des modèles Azure OpenAI.
Mises à jour du modèle
Azure OpenAI prend en charge les mises à jour automatiques pour les déploiements de modèles sélectionnés. Sur les modèles où la prise en charge des mises à jour automatiques existe, une liste déroulante de stratégie de mise à niveau de la version est disponible.
Vous pouvez en savoir plus sur les versions du modèle Azure OpenAI et leur fonctionnement dans l’article sur les versions du modèle Azure OpenAI.
Remarque
Les mises à jour automatiques des modèles sont uniquement prises en charge pour les types de déploiement standards. Pour plus d'informations sur la façon de gérer les mises à niveau et les migrations de modèles pour les types de déploiement approvisionnés, consultez la section Gestion des modèles sur les types de déploiement approvisionnés
Mise à jour automatique vers la valeur par défaut
Lorsque vous définissez votre déploiement sur Mise à jour automatique vers la valeur par défaut, votre modèle de déploiement est automatiquement mis à jour dans les deux semaines suivant une modification de la version par défaut. Dans le cas d’une version préliminaire, la mise à jour se fait automatiquement lorsqu’une nouvelle version préliminaire est disponible, deux semaines après la publication de la nouvelle version préliminaire.
Si vous en êtes encore aux premières phases de test des modèles d'inférence, nous vous recommandons de déployer des modèles avec une mise à jour automatique par défaut dès qu'elle est disponible.
Version de modèle spécifique
À mesure que votre utilisation d’Azure OpenAI évolue et que vous commencez à créer et à intégrer des applications, vous pouvez vouloir contrôler manuellement les mises à jour du modèle. Vous pouvez d’abord tester et valider que le comportement de votre application est cohérent pour votre cas d’usage avant d’effectuer la mise à niveau.
Lorsque vous sélectionnez une version de modèle spécifique à un déploiement, elle reste celle qui est sélectionnée jusqu’à ce que vous choisissiez d’effectuer vous-même une mise à jour manuelle ou une fois la date de mise hors service du modèle atteinte. Lorsque la date de retrait est atteinte, le modèle sera automatiquement mis à niveau vers la version par défaut au moment du retrait.
Configuration de la mise à niveau du modèle de déploiement
Vous pouvez vérifier quelles options de mise à niveau de modèle sont définies pour les modèles précédemment déployés à l’aide de REST, d’Azure CLI et d’Azure PowerShell, ainsi qu’avec le portail Foundry.
La propriété correspondante est également accessible via REST, Azure PowerShell et Azure CLI.
| Choix | Lire | Mise à jour |
|---|---|---|
| REST | Oui. Si versionUpgradeOption n'est pas retourné, cela signifie que c'est null |
Oui |
| Azure PowerShell | Oui.
VersionUpgradeOption peut être vérifié pour $null |
Oui |
| Azure CLI | Oui. Elle indique null si versionUpgradeOption n'est pas définie. |
Non. Il n’est actuellement pas possible de mettre à jour l’option de mise à niveau de version. |
Il existe trois options distinctes de mise à niveau du modèle de déploiement :
| Nom | Descriptif |
|---|---|
OnceNewDefaultVersionAvailable |
Une fois qu’une nouvelle version est désignée comme version par défaut, le modèle de déploiement est automatiquement mis à niveau vers la version par défaut dans les deux semaines suivant la modification de cette désignation. |
OnceCurrentVersionExpired |
Une fois la date de mise hors service atteinte, le modèle de déploiement est automatiquement mis à niveau vers la version par défaut actuelle. |
NoAutoUpgrade |
Le modèle de déploiement n’est jamais automatiquement mis à niveau. Une fois la date de mise hors service atteinte, le modèle de déploiement cesse de fonctionner. Vous devez mettre à jour votre code en référençant ce déploiement pour qu’il pointe vers un modèle de déploiement non expiré. |
Remarque
null est équivalent à OnceCurrentVersionExpired. Si l’option de stratégie de mise à jour de version n’est pas présente dans les propriétés d’un modèle qui prend en charge les mises à niveau de modèle, cela indique que la valeur est actuellement null. Une fois que vous modifiez explicitement cette valeur, la propriété est visible sur la page des propriétés du studio, ainsi que via l’API REST.
Exemples
Passez en revue le guide de prise en main d’Azure PowerShell pour installer Azure PowerShell localement ou vous pouvez utiliser Azure Cloud Shell.
Les étapes ci-dessous illustrent la vérification de la propriété d’option VersionUpgradeOption et sa mise à jour :
# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
# Step 2: Show VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
# VersionUpgradeOption can be null. One way to check is:
$null -eq $deployment.Properties.VersionUpgradeOption
# Step 3: Update VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
# Repeat steps 1 and 2 to confirm the change.
# If you aren't sure about the deployment name, list all deployments under an account:
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
# Update to a new model version
# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
# Step 2: Show the current model version
$deployment.Properties.Model.Version
# Step 3: Update the model version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
# Repeat steps 1 and 2 to confirm the change.
Mettre à jour et déployer des modèles via l’API
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2025-06-01
Paramètres de chemin d’accès
| Paramètre | Type | Obligatoire ? | Descriptif |
|---|---|---|---|
accountName |
ficelle | Obligatoire | Nom de votre ressource Azure OpenAI. |
deploymentName |
ficelle | Obligatoire | Nom de déploiement choisi lorsque vous avez déployé un modèle existant ou nom que vous souhaitez donner à un nouveau modèle de déploiement. |
resourceGroupName |
ficelle | Obligatoire | Nom du groupe de ressources associé pour ce modèle de déploiement. |
subscriptionId |
ficelle | Obligatoire | ID d’abonnement de l’abonnement associé. |
api-version |
ficelle | Obligatoire | Version de l’API à utiliser pour cette opération. Cela suit le format AAAA-MM-JJ. |
Versions prises en charge
-
2025-06-01Spécification Swagger
Corps de la demande
Il s’agit uniquement d’un sous-ensemble des paramètres disponibles du corps de la demande. Pour obtenir la liste complète des paramètres, consultez la documentation de référence sur l’API REST.
| Paramètre | Type | Descriptif |
|---|---|---|
| versionUpgradeOption | Chaîne | Options de mise à niveau d’une version du modèle de déploiement :OnceNewDefaultVersionAvailableOnceCurrentVersionExpiredNoAutoUpgrade |
| capacité | entier | Cela représente la quantité de quota que vous affectez à ce déploiement. Une valeur de 1 équivaut à 1 000 jetons par minute (TPM) |
Exemple de requête
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2025-06-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
Remarque
Il existe plusieurs façons de générer un jeton d’autorisation. La méthode la plus simple pour le test initial consiste à lancer le service Cloud Shell à partir du Portail Azure. Exécutez ensuite az account get-access-token. Vous pouvez utiliser ce jeton comme jeton d’autorisation temporaire pour le test d’API.
Exemple de réponse
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-35-turbo",
"sku": {
"name": "Standard",
"capacity": 120
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-35-turbo",
"version": "0613"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"capabilities": {
"chatCompletion": "true"
},
"provisioningState": "Succeeded",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 120
},
{
"key": "token",
"renewalPeriod": 60,
"count": 120000
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2023-02-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2023-10-31T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Gestion des modèles pour les types de déploiement approvisionnés
Les déploiements approvisionnés prennent en charge des pratiques distinctes de gestion des modèles. Les pratiques de gestion des modèles de déploiement approvisionnés sont censées vous donner le meilleur contrôle sur le moment et la façon dont vous migrez entre les versions et familles de modèles. Actuellement, il existe deux approches pour gérer les modèles sur les déploiements approvisionnés : (1) les migrations sur place et (2) les migrations à multidéploiement.
Conditions préalables
- Vérifiez que la version ou famille de modèle cible est prise en charge pour votre type de déploiement existant. Les migrations peuvent uniquement se produire entre des déploiements approvisionnés qui ont le même type de déploiement. Pour plus d’informations sur les types de déploiement, consultez la documentation sur le type de déploiement.
- Validez la disponibilité de capacité pour votre version ou famille de modèle cible avant de tenter une migration. Pour plus d’informations sur comment déterminer la disponibilité de la capacité, consultez la documentation sur la transparence de capacité.
- Pour les migrations à multidéploiement, vous devez valider que vous disposez d’un quota suffisant pour prendre en charge plusieurs déploiements simultanés. Pour plus d’informations sur la validation du quota pour chaque type de déploiement provisionné, consultez la documentation sur le coût de débit provisionné.
Migrations sur place pour les déploiements approvisionnés
Les migrations sur place vous permettent de conserver le même nom et la même taille de déploiement approvisionné lorsque vous modifiez la version ou la famille de modèle affectée à ce déploiement. Avec les migrations sur place, Azure OpenAI s’occupe de migrer tout trafic existant entre les versions de modèle ou les familles de modèles tout au long de la migration sur une fenêtre de 20 à 30 minutes. Pendant ce créneau de migration, votre déploiement approvisionné affiche l’état approvisionné « mise à jour ». Vous pouvez continuer d’utiliser votre déploiement approvisionné comme d’habitude. Une fois la migration sur place terminée, l’état approvisionné est actualisé à l’état « réussi », indiquant que tout le trafic a été migré vers la version ou la famille du modèle cible.
Migration sur place : mise à jour de version du modèle
Les migrations sur place qui ciblent la mise à jour d’un déploiement provisionné existant vers une nouvelle version de modèle au sein de la même famille de modèles sont prises en charge via Foundry, l’API REST et Azure CLI. Pour effectuer une migration sur place ciblant une mise à jour de version de modèle dans Foundry, sélectionnez Déploiements> sous la colonne nom du déploiement, sélectionnez le nom de déploiement du déploiement provisionné que vous souhaitez migrer.
Sélectionner le nom d’un déploiement ouvre les Propriétés du modèle de déploiement. Dans cet affichage, sélectionnez le bouton modifier pour afficher la boîte de dialogue Mettre à jour le déploiement. Sélectionnez la liste déroulante de version du modèle pour définir une nouvelle version de modèle pour le déploiement approvisionné. Comme nous l’avons déjà indiqué, l’état d’approvisionnement passe à « mise à jour » pendant la migration et repasse sur « réussi » une fois la migration terminée.
Migration sur place : modification de la famille du modèle
Les migrations sur place qui ciblent la mise à jour d’un déploiement provisionné existant vers une nouvelle famille de modèles sont prises en charge via l’API REST et Azure CLI. Pour effectuer une migration sur place qui cible une modification de famille de modèle, utilisez l’exemple de requête ci-dessous comme guide. Dans la demande, vous devez mettre à jour le nom du modèle et la version du modèle pour le modèle cible vers lequel vous effectuez la migration.
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'
Exemple de réponse
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-4o-ptu-deployment",
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 100
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-4o-mini",
"version": "2024-07-18"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"currentCapacity": 100,
"capabilities": {
"area": "EUR",
"chatCompletion": "true",
"jsonObjectResponse": "true",
"maxContextToken": "128000",
"maxOutputToken": "16834",
"assistants": "true"
},
"provisioningState": "Updating",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 300
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2025-01-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2025-01-29T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Remarque
Il existe plusieurs façons de générer un jeton d’autorisation. La méthode la plus simple pour le test initial consiste à lancer le service Cloud Shell à partir du Portail Azure. Exécutez ensuite az account get-access-token. Vous pouvez utiliser ce jeton comme jeton d’autorisation temporaire pour le test d’API.
Migrations multidéploiement pour déploiements approvisionnés
Les migrations multidéploiement vous permettent d’avoir plus de contrôle sur le processus de migration de modèle. Avec les migrations multidéploiement, vous pouvez dicter la rapidité avec laquelle vous souhaitez migrer votre trafic existant vers la version ou la famille de modèle cible sur un nouveau déploiement approvisionné. Le processus de migration vers une nouvelle version ou famille de modèle avec la méthode de migration multidéploiement est le suivant :
- Créez un déploiement approvisionné. Pour ce nouveau déploiement, vous pouvez choisir de conserver le même type de déploiement approvisionné que votre déploiement existant ou sélectionner un nouveau type de déploiement si vous le souhaitez.
- Transitionnez le trafic depuis le déploiement approvisionné existant vers le nouveau déploiement approvisionné avec votre version ou famille de modèle cible, jusqu’à ce que tout le trafic soit déchargé du déploiement d’origine.
- Une fois le trafic migré vers le nouveau déploiement, vérifiez qu’aucune demande d’inférence n’est traitée sur le déploiement provisionné précédent en veillant à ce que la métrique Demandes Azure OpenAI n’affiche aucun appel d’API effectué dans les 5 à 10 minutes suivant la migration du trafic d’inférence vers le nouveau déploiement. Pour plus d’informations sur cette métrique, consultez la documentation Monitor Azure OpenAI.
- Une fois que vous confirmez qu’aucun appel d’inférence n’a été effectué, supprimez le déploiement approvisionné d’origine.
Résolution des problèmes
Vous obtenez 401 ou 403 réponses de l’API Azure Resource Manager
- Vérifiez que votre jeton d’accès est valide et non expiré.
- Vérifiez que vous disposez de l’autorisation de lire et de mettre à jour les déploiements pour la ressource.