Modèles Azure OpenAI Service

Azure OpenAI Service est fourni avec par un ensemble diversifié de modèles proposant des fonctionnalités variées et des prix différents. La disponibilité des modèles varie selon la région. Pour en savoir plus sur les modèles GPT-3 et certains autres mis hors service en juillet 2024, consultez l’articles Modèles Azure OpenAI Service hérités.

Modèles Description
GPT-4 Ensemble de modèles qui améliorent GPT-3.5 et qui permettent de comprendre et fr générer du langage naturel et du code.
GPT-3.5 Ensemble de modèles qui améliorent GPT-3 et qui permettent de comprendre et de générer du langage naturel et du code.
Incorporations Ensemble de modèles qui permettent de convertir du texte en forme vectorielle numérique pour faciliter la similarité du texte.
DALL-E (préversion) Série de modèles en avant-première permettant de générer des images originales à partir d’un langage naturel.

GPT-4

GPT-4 peut résoudre des problèmes difficiles avec une plus grande précision que n’importe lequel des modèles précédents d’OpenAI. Comme GPT-3.5 Turbo, GPT-4 est optimisé pour la conversation, mais fonctionne bien pour les tâches d’achèvement classiques. Utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-4. Pour en savoir plus les interactions avec GPT-4 et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.

En raison de la forte demande, l’accès à cette série de modèles n’est disponible que sur demande pour le moment. Pour demander l’accès, les clients Azure OpenAI existants peuvent s’inscrire en remplissant ce formulaire

  • gpt-4
  • gpt-4-32k

Le modèle gpt-4 prend en charge 8 192 jetons d’entrée maximum et le modèle gpt-4-32k prend en charge jusqu’à 32 768 jetons.

GPT-3.5

Les modèles GPT-3.5 peuvent comprendre et générer un langage naturel ou du code. GPT-3.5 Turbo s’inscrit comme le modèle le plus performant et le plus économique de la famille GPT-3.5. Il a été optimisé pour la conversation et fonctionne également bien pour les tâches traditionnelles de saisie semi-automatique. Nous recommandons d’utiliser GPT-3.5 Turbo plutôt que les modèles GPT-3.5 et GPT-3 hérités.

  • gpt-35-turbo
  • gpt-35-turbo-16k

Le modèle gpt-35-turbo prend en charge 4 096 jetons d’entrée maximum et le modèle gpt-35-turbo-16k prend en charge jusqu’à 16 384 jetons.

Comme GPT-4, utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-3.5 Turbo. Pour en savoir plus les interactions avec GPT-3.5 Turbo et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.

Modèles Incorporations

Important

Nous vous recommandons vivement d’utiliser text-embedding-ada-002 (Version 2). Ce modèle/cette version fournit une parité avec text-embedding-ada-002 d’OpenAI. Pour en savoir plus sur les améliorations offertes par ce modèle, veuillez vous reporter au billet de blog d’OpenAI. Même si vous utilisez actuellement la version 1, vous devez migrer vers la version 2 pour tirer parti des dernières pondérations/limites de jetons mises à jour. Les versions 1 et 2 ne sont pas interchangeables. L’incorporation et la recherche de documents doivent donc être effectuées à l’aide de la même version du modèle.

Actuellement, nous proposons trois familles de modèles d’incorporation avec différentes fonctionnalités. La liste suivante indique la longueur du vecteur numérique retourné par le service, en fonction de la fonctionnalité du modèle :

Modèle de base Modèle(s) Dimensions
Ada modèles se terminant par -001 (version 1) 1 024
Ada text-embedding-ada-002 (Version 2) 1536

DALL-E (préversion)

Les modèles DALL-E, actuellement en préversion, génèrent des images à partir des invites de texte que l’utilisateur fournit.

Tableau récapitulatif des modèles et de leur disponibilité par région

Important

USA Centre Sud est temporairement indisponible pour la création de nouvelles ressources en raison d’une forte demande.

Modèles GPT-4

Ces modèles peuvent être utilisés uniquement avec l’API d’achèvement de conversation.

ID de modèle Régions pour modèle de base Régions pour optimisation Nbre max. de requêtes (jetons) Données d’entraînement (date max.)
gpt-41,2 (0314) USA Est, France Centre N/A 8 192 Septembre 2021
gpt-4-32k1,2 (0314) USA Est, France Centre N/A 32,768 Septembre 2021
gpt-41 (0613) USA Est, France Centre N/A 8 192 Septembre 2021
gpt-4-32k1 (0613) USA Est, France Centre N/A 32,768 Septembre 2021

1 Le modèle est disponible sur demande uniquement.
2 La version 0314 de GPT-4 et GPT-4-32k sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.

Modèles GPT-3.5

GPT-3.5 Turbo est utilisé avec l’API de saisie semi-automatique de conversation. GPT-3.5 Turbo (0301) peut également être utilisé avec l’API de saisie semi-automatique. GPT3.5 Turbo (0613) prend uniquement en charge l’API de saisie semi-automatique de conversation.

ID de modèle Régions pour modèle de base Régions pour optimisation Nbre max. de requêtes (jetons) Données d’entraînement (date max.)
gpt-35-turbo1 (0301) USA Est, France Centre, USA Centre Sud, Royaume-Uni Sud, Europe Ouest N/A 4 096 Septembre 2021
gpt-35-turbo (0613) USA Est, France Centre, Royaume-Uni Sud N/A 4 096 Septembre 2021
gpt-35-turbo-16k (0613) USA Est, France Centre, Royaume-Uni Sud N/A 16 384 Septembre 2021

1 La version 0301 de GPT-35-Turbo sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.

Modèles Incorporations

Ces modèles peuvent être utilisés uniquement avec des demandes d’API d’incorporation.

Notes

Nous vous recommandons vivement d’utiliser text-embedding-ada-002 (Version 2). Ce modèle/cette version fournit une parité avec text-embedding-ada-002 d’OpenAI. Pour en savoir plus sur les améliorations offertes par ce modèle, veuillez vous reporter au billet de blog d’OpenAI. Même si vous utilisez actuellement la version 1, vous devez migrer vers la version 2 pour tirer parti des dernières pondérations/limites de jetons mises à jour. Les versions 1 et 2 ne sont pas interchangeables. L’incorporation et la recherche de documents doivent donc être effectuées à l’aide de la même version du modèle.

ID de modèle Régions pour modèle de base Régions pour optimisation Nbre max. de requêtes (jetons) Données d’entraînement (date max.)
text-embedding-ada-002 (version 2) USA Est, USA Centre Sud, Europe Ouest N/A 8 191 Septembre 2021
text-embedding-ada-002 (version 1) USA Est, USA Centre Sud, Europe Ouest N/A 2 046 Septembre 2021

Modèles DALL-E (préversion)

ID de modèle Régions pour modèle de base Régions pour optimisation Requête maximale (caractères) Données d’entraînement (date max.)
dalle2 USA Est N/A 1 000 N/A

Utilisation des modèles

Recherche des modèles disponibles

Vous pouvez obtenir la liste des modèles disponibles pour l’inférence et l’optimisation par votre ressource Azure OpenAI en utilisant l’API Liste de modèles.

Mises à jour de modèle

Azure OpenAI prend désormais en charge les mises à jour automatiques pour certains modèles de déploiement. Sur des modèles où la prise en charge des mises à jour automatiques est disponible, une liste déroulante de version de modèle est visible dans Azure OpenAI Studio sous Créer un déploiement et Modifier le déploiement :

Capture d’écran de l’interface utilisateur du modèle de déploiement d’Azure OpenAI Studio.

Mise à jour automatique vers la valeur par défaut

Lorsque la mise à jour automatique vers la valeur par défaut est sélectionnée, votre modèle de déploiement est automatiquement mis à jour dans les deux semaines suivant la publication d’une nouvelle version.

Si vous vous trouvez encore dans les premières phases de test des modèles basés sur la saisie semi-automatique et la saisie semi-automatique de conversation, nous recommandons de déployer des modèles avec l’option Mise à jour automatique vers la valeur par défaut dès que possible.

Version de modèle spécifique

À mesure que votre utilisation d’Azure OpenAI évolue et que vous commencez à générer et à intégrer des applications, vous souhaiterez probablement contrôler manuellement des mises à jour de modèles afin de pouvoir d’abord tester et valider la cohérence des performances du modèle pour votre cas d’usage antérieur à la mise à niveau.

Lorsque vous sélectionnez une version de modèle spécifique à un déploiement, elle reste celle sélectionnée jusqu’à ce que vous choisissiez d’effectuer vous-même une mise à jour manuelle ou une fois la date de mise hors service du modèle atteinte. À la date de mise hors service, le modèle effectue une mise à niveau automatique vers la version par défaut lors de la mise hors service.

Mise hors service de GPT-35-Turbo 0301 et de GPT-4 0314

Les modèles gpt-35-turbo (0301) et gpt-4 (0314) seront mis hors service le 4 janvier 2024. Lors de la mise hors service, les déploiements sont automatiquement mis à niveau vers la version par défaut à ce moment. Si vous souhaitez que votre déploiement cesse d’accepter des demandes d’achèvement plutôt qu’une mise à niveau, vous pouvez alors définir l’option de mise à niveau du modèle pour qu’elle expire via l’API. Nous publierons des lignes directrices à ce sujet d’après le 1er septembre.

Affichage des dates de dépréciation

Pour les modèles actuellement déployés, à partir d’Azure OpenAI Studio, sélectionnez Déploiements :

Capture d’écran de l’interface utilisateur de déploiement d’Azure OpenAI Studio.

Pour afficher les dates de dépréciation/d’expiration pour tous les modèles disponibles d’une région donnée à partir d’Azure OpenAI Studio, sélectionnezOptions de colonne>Modèles> Sélectionnez Ajuster la dépréciation et Inférence de dépréciation :

Capture d’écran de l’interface utilisateur des modèles d’Azure OpenAI Studio.

Mettre à jour des modèles de déploiement & via l’API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01

Paramètres de chemin d’accès

Paramètre Type Requis ? Description
acountname string Obligatoire Nom de votre ressource Azure OpenAI.
deploymentName string Obligatoire Nom de déploiement choisi lorsque vous avez déployé un modèle existant ou nom que vous souhaitez donner à un nouveau modèle de déploiement.
resourceGroupName string Obligatoire Nom du groupe de ressources associé pour ce modèle de déploiement.
subscriptionId string Obligatoire ID d’abonnement de l’abonnement associé.
api-version string Obligatoire Version de l’API à utiliser pour cette opération. Cela suit le format AAAA-MM-JJ.

Versions prises en charge

Corps de la demande

Il s’agit uniquement d’un sous-ensemble des paramètres disponibles du corps de la demande. Pour obtenir la liste complète des paramètres, consultez la spécification de l’API REST.

Paramètre Type Description
versionUpgradeOption String Options de mise à niveau d’une version du modèle de déploiement :
OnceNewDefaultVersionAvailable
OnceCurrentVersionExpired
NoAutoUpgrade
capacité entier Représente la part de quota que vous affectez à ce déploiement. Une valeur de 1 équivaut à 1 000 jetons par minute (TPM)

Exemple de requête

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1" \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":1},"properties": {"model": {"format": "OpenAI","name": "text-embedding-ada-002","version": "2"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Notes

Il existe plusieurs façons de générer un jeton d’autorisation. La méthode la plus simple pour le test initial consiste à lancer le service Cloud Shell à partir de https://portal.azure.com. Exécutez ensuite az account get-access-token. Vous pouvez utiliser ce jeton comme jeton d’autorisation temporaire pour le test d’API.

Exemple de réponse

{
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "text-embedding-ada-002-test-1",
  "sku": {
    "name": "Standard",
    "capacity": 1
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "text-embedding-ada-002",
      "version": "2"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "embeddings": "true",
      "embeddingsMaxInputs": "1"
    },
    "provisioningState": "Succeeded",
    "ratelimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 2
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 1000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-06-13T00:12:38.885937Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-06-13T02:41:04.8410965Z"
  },
  "etag": "\"{GUID}\""
}

Étapes suivantes