Modèles Azure OpenAI Service

Article
07/17/2023

Azure OpenAI Service est fourni avec par un ensemble diversifié de modèles proposant des fonctionnalités variées et des prix différents. La disponibilité des modèles varie selon la région. Pour en savoir plus sur les modèles GPT-3 et certains autres mis hors service en juillet 2024, consultez l’articles Modèles Azure OpenAI Service hérités.

Modèles	Description
GPT-4	Ensemble de modèles qui améliorent GPT-3.5 et qui permettent de comprendre et fr générer du langage naturel et du code.
GPT-3.5	Ensemble de modèles qui améliorent GPT-3 et qui permettent de comprendre et de générer du langage naturel et du code.
Incorporations	Ensemble de modèles qui permettent de convertir du texte en forme vectorielle numérique pour faciliter la similarité du texte.
DALL-E (préversion)	Série de modèles en avant-première permettant de générer des images originales à partir d’un langage naturel.

GPT-4

GPT-4 peut résoudre des problèmes difficiles avec une plus grande précision que n’importe lequel des modèles précédents d’OpenAI. Comme GPT-3.5 Turbo, GPT-4 est optimisé pour la conversation, mais fonctionne bien pour les tâches d’achèvement classiques. Utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-4. Pour en savoir plus les interactions avec GPT-4 et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.

En raison de la forte demande, l’accès à cette série de modèles n’est disponible que sur demande pour le moment. Pour demander l’accès, les clients Azure OpenAI existants peuvent s’inscrire en remplissant ce formulaire

gpt-4
gpt-4-32k

Le modèle gpt-4 prend en charge 8 192 jetons d’entrée maximum et le modèle gpt-4-32k prend en charge jusqu’à 32 768 jetons.

GPT-3.5

Les modèles GPT-3.5 peuvent comprendre et générer un langage naturel ou du code. GPT-3.5 Turbo s’inscrit comme le modèle le plus performant et le plus économique de la famille GPT-3.5. Il a été optimisé pour la conversation et fonctionne également bien pour les tâches traditionnelles de saisie semi-automatique. Nous recommandons d’utiliser GPT-3.5 Turbo plutôt que les modèles GPT-3.5 et GPT-3 hérités.

gpt-35-turbo
gpt-35-turbo-16k

Le modèle gpt-35-turbo prend en charge 4 096 jetons d’entrée maximum et le modèle gpt-35-turbo-16k prend en charge jusqu’à 16 384 jetons.

Comme GPT-4, utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-3.5 Turbo. Pour en savoir plus les interactions avec GPT-3.5 Turbo et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.

Modèles Incorporations

Important

Nous vous recommandons vivement d’utiliser text-embedding-ada-002 (Version 2). Ce modèle/cette version fournit une parité avec text-embedding-ada-002 d’OpenAI. Pour en savoir plus sur les améliorations offertes par ce modèle, veuillez vous reporter au billet de blog d’OpenAI. Même si vous utilisez actuellement la version 1, vous devez migrer vers la version 2 pour tirer parti des dernières pondérations/limites de jetons mises à jour. Les versions 1 et 2 ne sont pas interchangeables. L’incorporation et la recherche de documents doivent donc être effectuées à l’aide de la même version du modèle.

Actuellement, nous proposons trois familles de modèles d’incorporation avec différentes fonctionnalités. La liste suivante indique la longueur du vecteur numérique retourné par le service, en fonction de la fonctionnalité du modèle :

Modèle de base	Modèle(s)	Dimensions
Ada	modèles se terminant par -001 (version 1)	1 024
Ada	text-embedding-ada-002 (Version 2)	1536

DALL-E (préversion)

Les modèles DALL-E, actuellement en préversion, génèrent des images à partir des invites de texte que l’utilisateur fournit.

Tableau récapitulatif des modèles et de leur disponibilité par région

Important

USA Centre Sud est temporairement indisponible pour la création de nouvelles ressources en raison d’une forte demande.

Modèles GPT-4

Ces modèles peuvent être utilisés uniquement avec l’API d’achèvement de conversation.

ID de modèle	Régions pour modèle de base	Régions pour optimisation	Nbre max. de requêtes (jetons)	Données d’entraînement (date max.)
`gpt-4`^1,² (0314)	USA Est, France Centre	N/A	8 192	Septembre 2021
`gpt-4-32k`^1,² (0314)	USA Est, France Centre	N/A	32,768	Septembre 2021
`gpt-4`¹ (0613)	USA Est, France Centre	N/A	8 192	Septembre 2021
`gpt-4-32k`¹ (0613)	USA Est, France Centre	N/A	32,768	Septembre 2021

¹ Le modèle est disponible sur demande uniquement.
² La version 0314 de GPT-4 et GPT-4-32k sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.

Modèles GPT-3.5

GPT-3.5 Turbo est utilisé avec l’API de saisie semi-automatique de conversation. GPT-3.5 Turbo (0301) peut également être utilisé avec l’API de saisie semi-automatique. GPT3.5 Turbo (0613) prend uniquement en charge l’API de saisie semi-automatique de conversation.

ID de modèle	Régions pour modèle de base	Régions pour optimisation	Nbre max. de requêtes (jetons)	Données d’entraînement (date max.)
`gpt-35-turbo`¹ (0301)	USA Est, France Centre, USA Centre Sud, Royaume-Uni Sud, Europe Ouest	N/A	4 096	Septembre 2021
`gpt-35-turbo` (0613)	USA Est, France Centre, Royaume-Uni Sud	N/A	4 096	Septembre 2021
`gpt-35-turbo-16k` (0613)	USA Est, France Centre, Royaume-Uni Sud	N/A	16 384	Septembre 2021

¹ La version 0301 de GPT-35-Turbo sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.

Modèles Incorporations

Ces modèles peuvent être utilisés uniquement avec des demandes d’API d’incorporation.

Notes

ID de modèle	Régions pour modèle de base	Régions pour optimisation	Nbre max. de requêtes (jetons)	Données d’entraînement (date max.)
text-embedding-ada-002 (version 2)	USA Est, USA Centre Sud, Europe Ouest	N/A	8 191	Septembre 2021
text-embedding-ada-002 (version 1)	USA Est, USA Centre Sud, Europe Ouest	N/A	2 046	Septembre 2021

Modèles DALL-E (préversion)

ID de modèle	Régions pour modèle de base	Régions pour optimisation	Requête maximale (caractères)	Données d’entraînement (date max.)
dalle2	USA Est	N/A	1 000	N/A

Utilisation des modèles

Recherche des modèles disponibles

Vous pouvez obtenir la liste des modèles disponibles pour l’inférence et l’optimisation par votre ressource Azure OpenAI en utilisant l’API Liste de modèles.

Mises à jour de modèle

Azure OpenAI prend désormais en charge les mises à jour automatiques pour certains modèles de déploiement. Sur des modèles où la prise en charge des mises à jour automatiques est disponible, une liste déroulante de version de modèle est visible dans Azure OpenAI Studio sous Créer un déploiement et Modifier le déploiement :

Mise à jour automatique vers la valeur par défaut

Lorsque la mise à jour automatique vers la valeur par défaut est sélectionnée, votre modèle de déploiement est automatiquement mis à jour dans les deux semaines suivant la publication d’une nouvelle version.

Si vous vous trouvez encore dans les premières phases de test des modèles basés sur la saisie semi-automatique et la saisie semi-automatique de conversation, nous recommandons de déployer des modèles avec l’option Mise à jour automatique vers la valeur par défaut dès que possible.

Version de modèle spécifique

À mesure que votre utilisation d’Azure OpenAI évolue et que vous commencez à générer et à intégrer des applications, vous souhaiterez probablement contrôler manuellement des mises à jour de modèles afin de pouvoir d’abord tester et valider la cohérence des performances du modèle pour votre cas d’usage antérieur à la mise à niveau.

Lorsque vous sélectionnez une version de modèle spécifique à un déploiement, elle reste celle sélectionnée jusqu’à ce que vous choisissiez d’effectuer vous-même une mise à jour manuelle ou une fois la date de mise hors service du modèle atteinte. À la date de mise hors service, le modèle effectue une mise à niveau automatique vers la version par défaut lors de la mise hors service.

Mise hors service de GPT-35-Turbo 0301 et de GPT-4 0314

Les modèles gpt-35-turbo (0301) et gpt-4 (0314) seront mis hors service le 4 janvier 2024. Lors de la mise hors service, les déploiements sont automatiquement mis à niveau vers la version par défaut à ce moment. Si vous souhaitez que votre déploiement cesse d’accepter des demandes d’achèvement plutôt qu’une mise à niveau, vous pouvez alors définir l’option de mise à niveau du modèle pour qu’elle expire via l’API. Nous publierons des lignes directrices à ce sujet d’après le 1er septembre.

Affichage des dates de dépréciation

Pour les modèles actuellement déployés, à partir d’Azure OpenAI Studio, sélectionnez Déploiements :

Pour afficher les dates de dépréciation/d’expiration pour tous les modèles disponibles d’une région donnée à partir d’Azure OpenAI Studio, sélectionnezOptions de colonne>Modèles> Sélectionnez Ajuster la dépréciation et Inférence de dépréciation :

Mettre à jour des modèles de déploiement & via l’API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01

Paramètres de chemin d’accès

Paramètre	Type	Requis ?	Description
`acountname`	string	Obligatoire	Nom de votre ressource Azure OpenAI.
`deploymentName`	string	Obligatoire	Nom de déploiement choisi lorsque vous avez déployé un modèle existant ou nom que vous souhaitez donner à un nouveau modèle de déploiement.
`resourceGroupName`	string	Obligatoire	Nom du groupe de ressources associé pour ce modèle de déploiement.
`subscriptionId`	string	Obligatoire	ID d’abonnement de l’abonnement associé.
`api-version`	string	Obligatoire	Version de l’API à utiliser pour cette opération. Cela suit le format AAAA-MM-JJ.

Versions prises en charge

2023-05-01Spécification Swagger

Corps de la demande

Il s’agit uniquement d’un sous-ensemble des paramètres disponibles du corps de la demande. Pour obtenir la liste complète des paramètres, consultez la spécification de l’API REST.

Paramètre	Type	Description
versionUpgradeOption	String	Options de mise à niveau d’une version du modèle de déploiement : `OnceNewDefaultVersionAvailable` `OnceCurrentVersionExpired` `NoAutoUpgrade`
capacité	entier	Représente la part de quota que vous affectez à ce déploiement. Une valeur de 1 équivaut à 1 000 jetons par minute (TPM)

Exemple de requête

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1" \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":1},"properties": {"model": {"format": "OpenAI","name": "text-embedding-ada-002","version": "2"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Notes

Il existe plusieurs façons de générer un jeton d’autorisation. La méthode la plus simple pour le test initial consiste à lancer le service Cloud Shell à partir de https://portal.azure.com. Exécutez ensuite az account get-access-token. Vous pouvez utiliser ce jeton comme jeton d’autorisation temporaire pour le test d’API.

Exemple de réponse

{
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "text-embedding-ada-002-test-1",
  "sku": {
    "name": "Standard",
    "capacity": 1
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "text-embedding-ada-002",
      "version": "2"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "embeddings": "true",
      "embeddingsMaxInputs": "1"
    },
    "provisioningState": "Succeeded",
    "ratelimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 2
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 1000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-06-13T00:12:38.885937Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-06-13T02:41:04.8410965Z"
  },
  "etag": "\"{GUID}\""
}

Modèles Azure OpenAI Service

GPT-4

GPT-3.5

Modèles Incorporations

DALL-E (préversion)

Tableau récapitulatif des modèles et de leur disponibilité par région

Modèles GPT-4

Modèles GPT-3.5

Modèles Incorporations

Modèles DALL-E (préversion)

Utilisation des modèles

Recherche des modèles disponibles

Mises à jour de modèle

Mise à jour automatique vers la valeur par défaut

Version de modèle spécifique

Mise hors service de GPT-35-Turbo 0301 et de GPT-4 0314

Affichage des dates de dépréciation

Mettre à jour des modèles de déploiement & via l’API

Exemple de requête

Exemple de réponse

Étapes suivantes

Ressources supplémentaires