Partager via


Azure OpenAI dans les modèles Azure AI Foundry model de dépréciations et de retraits

Aperçu

Les modèles Azure OpenAI sont continuellement actualisés avec des modèles plus récents et plus compatibles. Dans le cadre de ce processus, nous déprécions et nous mettons hors service des modèles plus anciens. Ce document fournit des informations sur les modèles qui sont actuellement disponibles, déconseillés ou supprimés.

Terminologie

  • Dépréciation
    • Quand un modèle est déconseillé, il n’est plus disponible pour les nouveaux clients. Il reste disponible pour être utilisé par des clients qui ont des déploiements existants, jusqu’à ce que le modèle soit mis hors service.
  • Mise hors service
    • Quand un modèle est mis hors service, il n’est plus disponible pour être utilisé. Les déploiements Azure OpenAI d’un modèle supprimé retournent toujours des réponses d’erreur.

Avis

Azure OpenAI informe les clients des déploiements actifs d'Azure OpenAI pour les modèles avec des retraits prévus. Nous informons les clients des mises hors service à venir comme suit pour chaque déploiement :

  1. Lors du lancement du modèle, nous désignons de manière programmatique une date de mise hors service « pas plus tôt que » (pour les modèles en préversion, cela se situe entre 90 et 120 jours après le lancement, et pour les modèles en disponibilité générale, c'est 365 jours après le lancement).
  2. Notification au moins 60 jours avant la mise hors service du modèle pour les modèles en disponibilité générale.
  3. Un préavis d'au moins 30 jours avant les mises à niveau du modèle en préversion.

Les mises hors service sont effectués de façon progressive, région par région. Aucune planification n’est prévue quand une région spécifique ou une référence SKU sera mise à niveau.

Qui est informé des mises hors service à venir ?

Azure OpenAI avertit les clients par le biais de deux méthodes :

  • Azure Resource Health - Toute personne disposant d’autorisations de lecteur ou supérieure peut voir les alertes d’intégrité Azure, ainsi que configurer des alertes personnalisées par e-mail, SMS, etc. Voir Créer des alertes d’intégrité du service
  • E-mail : les notifications par e-mail sont automatiquement envoyées aux propriétaires d’abonnements. Toute personne disposant d’autorisations de lecture peut toutefois configurer ses propres alertes en suivant les instructions ci-dessus.

Configuration du filtre Azure Service Health :

Services = azure OpenAI service (la casse reflète l’expérience utilisateur actuelle).

Types d’événements- Health advisories = Upgrade, Deprecation, & Retirement Notifications- Service issue = Outages (Recommandé uniquement si vous souhaitez être averti des pannes)

Si vous souhaitez recevoir des alertes textuelles SMS plutôt que simplement des e-mails, vous devez sélectionner Créer un groupe d’actions et, sous Type de notification, sélectionnez E-mail/SMS/Push/Voice , puis configurer votre numéro de téléphone.

Disponibilité du modèle

  1. Au moins une année de disponibilité pour les modèles en disponibilité générale après la date de publication d’un modèle dans au moins une région dans le monde entier
  2. Pour les déploiements globaux, toutes les futures versions de modèle débutant par gpt-4o et gpt-4 0409 seront disponibles avec leur prochain modèle succédant N pour comparaison ensemble.
  3. Les clients ont 60 jours pour essayer un nouveau modèle en disponibilité générale dans au moins une région globale ou standard, avant toute mise à niveau vers un modèle en disponibilité générale plus récent.

Éléments à prendre en considération concernant le cloud public Azure

Soyez conscient des éléments suivants :

  1. Toutes les combinaisons de versions du modèle ne seront pas disponibles dans toutes les régions.
  2. Les versions N et N+1 du modèle peuvent ne pas toujours être disponibles dans la même région.
  3. La version N du modèle en disponibilité générale peut être mise à niveau vers une future version N+X du modèle dans certaines régions en fonction des limitations de capacité et sans que la nouvelle version N+X du modèle soit disponible séparément pour des tests dans la même région. La nouvelle version du modèle sera disponible pour des tests dans d’autres régions avant la planification de toute mise à niveau.
  4. Les versions de modèle en préversion et les versions en disponibilité générale du même modèle ne seront pas toujours disponibles pour être testées ensemble dans une même région. Des versions en préversion et en disponibilité générale seront disponibles pour des tests dans différentes régions.
  5. Nous nous réservons le droit de fixer des limites aux futurs clients d’une région particulière pour équilibrer la qualité du service pour les clients existants.
  6. Comme toujours chez Microsoft, la sécurité est de la plus grande importance. S’il s’avère qu’un modèle ou une version de modèle pose des problèmes de conformité ou de sécurité, nous nous réservons le droit d’invoquer la nécessité de procéder à des mises hors service d’urgence. Pour plus d’informations, consultez les conditions d’utilisation du service.

Éléments particuliers à prendre en considération pour les clouds Azure Government

  1. Les déploiements standard globaux ne seront pas disponibles dans les clouds gouvernementaux.
  2. Tous les modèles ou versions de modèle disponibles dans le cloud commercial/public ne seront pas disponibles dans les clouds gouvernementaux.
  3. Dans les clouds Azure Government, nous avons l’intention de prendre en charge une seule version d’un modèle donné à la fois.
    1. Par exemple, une seule version de gpt-35-turbo 0125 et de gpt-4o (2024-05-13).
  4. Il y aura toutefois un chevauchement de 30 jours entre les nouvelles versions de modèle, où plus de deux versions seront disponibles.
    1. Par exemple, si gpt-35-turbo 0125 ou gpt-4o (2024-05-13) est mis à jour vers une version ultérieure, ou
    2. pour les modifications de famille de modèles qui vont au-delà des mises à jour de version, telles que lors du passage de gpt-4 1106-preview à gpt-4o (2024-05-13).

Comment se préparer aux mises hors service et aux mises à niveau de version des modèles

Pour se préparer aux mises hors services et aux mises à niveau de version des modèles, nous recommandons aux clients de tester leurs applications avec les nouveaux modèles et les nouvelles versions, et d’évaluer leur comportement. Nous recommandons également aux clients de mettre à jour leurs applications de façon à utiliser les nouveaux modèles et les nouvelles versions avant la date de mise hors service.

Pour découvrir plus d’informations sur le processus d’évaluation de modèles, consultez le Guide sur la prise en main de l’évaluation des modèles.

Pour découvrir plus d’informations sur le processus de mise à niveau de modèles, consultez Comment effectuer une mise à niveau vers un nouveau modèle ou une nouvelle version.

Pour plus d'informations sur la gestion des mises à niveau et des migrations de modèles pour les déploiements provisionnés, consultez Gestion des modèles sur les types de déploiement provisionnés

Modèles actuels

Remarque

Tous les modèles ne passent pas par une période de dépréciation avant leur mise hors service. Certains modèles/versions n’ont qu’une date de mise hors service.

Les modèles affinés sont soumis à une dépréciation différente et à une planification de retrait différente de leur modèle de base équivalent.

Ces modèles sont actuellement disponibles pour une utilisation dans Azure OpenAI.

Génération de texte

Modèle Version Date de mise hors service Modèle de remplacement
gpt-4.5-preview 2025-02-27 Aucune mise à niveau automatique
14 juillet 2025
Version gpt-4.1 : 2025-04-14
gpt-3.5-turbo-instruct 0914 Pas plus tôt que le 16 juillet 2025
o1-preview 2024-09-12 28 juillet 2025 o1
computer-use-preview 11-03-2025 Pas plus tôt que le 1er septembre 2025
gpt-35-turbo 1106 Pas plus tôt que le 1er septembre 2025 Version gpt-4.1-mini : 2025-04-14
gpt-35-turbo 0125 Pas plus tôt que le 1er septembre 2025 Version gpt-4.1-mini : 2025-04-14
gpt-4 turbo-2024-04-09 Pas plus tôt que le 1er septembre 2025 Version gpt-4o : 2024-11-20
model router 19/05/2025 Pas plus tôt que le 1er septembre 2025
gpt-4o 13/05/2024 Pas plus tôt que le 15 septembre 2025 Version gpt-4.1 : 2025-04-14
gpt-4o-mini 18/07/2024 Pas plus tôt que le 15 septembre 2025 Version gpt-4.1-mini : 2025-04-14
o1-mini 2024-09-12 Pas plus tôt que le 26 septembre 2025
gpt-4o 06-08-2024 Pas plus tôt que le 15 octobre 2025 Version gpt-4.1 : 2025-04-14
o1 17/12/2024 Au plus tôt le 17 décembre 2025
o3-mini 31-01-2025 Pas plus tôt que le 1er février 2026
gpt-4o 20-11-2024 Pas plus tôt que le 1er mars 2026 Version gpt-4.1 : 2025-04-14
gpt-4.1 2025-04-14 Pas plus tôt que le 11 avril 2026
gpt-4.1-mini 2025-04-14 Pas plus tôt que le 11 avril 2026
gpt-4.1-nano 2025-04-14 Pas plus tôt que le 11 avril 2026
o4-mini 2025-04-16 Pas plus tôt que le 11 avril 2026
o3 2025-04-16 Pas plus tôt que le 11 avril 2026

Nous informons tous les clients avec ces déploiements en préversion au moins 30 jours avant le début des mises à niveau. Nous publions une planification de mise à niveau détaillant l’ordre des régions et des versions de modèle que nous suivons pendant les mises à niveau, et le lien vers cette planification à partir d’ici.

Conseil / Astuce

Une mise à niveau de modèle se produit-elle si la nouvelle version du modèle n’est pas encore disponible dans cette région ?

Oui, même dans les cas où la dernière version du modèle n’est pas encore disponible dans une région, nous mettons automatiquement à niveau les déploiements pendant la fenêtre de mise à niveau planifiée. Pour plus d’informations, consultez les versions du modèle Azure OpenAI.

Modèles ajustés

Les modèles affinés se retirent en deux phases : l’entraînement et le déploiement.

Tous les modèles affinés suivent leur modèle de base équivalent pour la mise hors service de l’entraînement. Une fois mis hors service, un modèle donné n’est plus disponible pour le réglage précis.

Pour les modèles affinés mis à la disposition générale depuis gpt-4o-2024-08-06, la mise hors service du déploiement se produit 1 an après la mise hors service de l’entraînement. Lors de la mise hors service du déploiement, l’inférence et le déploiement retournent des réponses d’erreur.

Modèle Version Date de mise hors service de l’entraînement Date de mise hors service du déploiement
gpt-35-turbo 1106 Lors de la mise hors service du modèle de base Lors de la mise hors service de l’entraînement
gpt-35-turbo 0125 Lors de la mise hors service du modèle de base Lors de la mise hors service de l’entraînement
gpt-4o 06-08-2024 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement
gpt-4o-mini 18/07/2024 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement
gpt-4.1 2025-04-14 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement
gpt-4.1-mini 2025-04-14 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement
gpt-4.1-nano 2025-04-14 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement
o4-mini 2025-04-16 Lors de la mise hors service du modèle de base Un an après la mise hors service de l’entraînement

Versions du modèle par défaut

Modèle Version par défaut actuelle Nouvelle version par défaut Date de mise à niveau par défaut
gpt-35-turbo 0301 0125 Les déploiements des versions 0301, 0613 et 1106 définis sur Mise à jour automatique vers la valeur par défaut seront automatiquement mis à niveau vers la version 0125 à partir du 21 janvier 2025.
gpt-4o 06-08-2024 - -

Historique des mises hors service et des dépréciations

Pour suivre les mises à jour individuelles de cet article, reportez-vous à l’historique Git