Modèles Azure OpenAI Service
Azure OpenAI Service est fourni avec par un ensemble diversifié de modèles proposant des fonctionnalités variées et des prix différents. La disponibilité des modèles varie selon la région. Pour en savoir plus sur les modèles GPT-3 et certains autres mis hors service en juillet 2024, consultez l’articles Modèles Azure OpenAI Service hérités.
Modèles | Description |
---|---|
GPT-4 | Ensemble de modèles qui améliorent GPT-3.5 et qui permettent de comprendre et de générer du langage naturel et du code. |
GPT-3.5 | Ensemble de modèles qui améliorent GPT-3 et qui permettent de comprendre et de générer du langage naturel et du code. |
Incorporations | Ensemble de modèles qui permettent de convertir du texte en forme vectorielle numérique pour faciliter la similarité du texte. |
DALL-E | Série de modèles qui peuvent générer des images originales en provenance d’un langage naturel. |
Chuchoter | Une série de modèles en préversion qui peuvent transcrire et traduire la reconnaissance vocale. |
Synthèse vocale (Préversion) | Série de modèles en préversion qui peuvent convertir du texte par synthèse vocale. |
Préversion de GPT-4 et GPT-4 Turbo
GPT-4 est un modèle modal volumineux (acceptant des entrées de texte ou d’image et générant du texte) qui peut résoudre des problèmes difficiles avec une plus grande précision que l’un des modèles précédents d’OpenAI. Comme GPT-3.5 Turbo, GPT-4 est optimisé pour la conversation, mais fonctionne bien pour les tâches d’achèvement classiques. Utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-4. Pour en savoir plus les interactions avec GPT-4 et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.
GPT-4 Turbo avec Vision est la version de GPT-4 qui accepte les entrées d’image. Il est disponible en tant que vision-preview
modèle de gpt-4
.
gpt-4
gpt-4-32k
Vous pouvez voir la longueur du contexte de jeton prise en charge par chaque modèle dans le tableau récapitulatif du modèle.
GPT-3.5
Les modèles GPT-3.5 peuvent comprendre et générer un langage naturel ou du code. GPT-3.5 Turbo s’inscrit comme le modèle le plus performant et le plus économique de la famille GPT-3.5. Il a été optimisé pour la conversation et fonctionne également bien pour les tâches traditionnelles de saisie semi-automatique. GPT-3.5 Turbo est disponible pour une utilisation avec l’API de saisies semi-automatiques des conversations. GPT-3.5 Turbo Instruct offre des fonctionnalités similaires à text-davinci-003
à l’aide de l’API de saisie semi-automatique au lieu de l’API de saisies semi-automatiques des conversations. Nous recommandons d’utiliser GPT-3.5 Turbo et GPT-3.5 Turbo Instruct plutôt que les modèles GPT-3.5 et GPT-3 hérités.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Vous pouvez voir la longueur du contexte de jeton prise en charge par chaque modèle dans le tableau récapitulatif du modèle.
Pour en savoir plus les interactions avec GPT-3.5 Turbo et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.
Incorporations
text-embedding-3-large
est le modèle incorporé le plus récent et le plus capable. La mise à niveau entre les modèles d’incorporation n’est pas possible. Pour passer de l’utilisation de text-embedding-ada-002
à text-embedding-3-large
vous devez générer de nouvelles incorporations.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Dans les tests, OpenAI signale à la fois les modèles d’incorporation de grande et petite troisième génération offrent de meilleures performances de récupération multi-langues moyennes avec le point de référence MIRACL tout en conservant les performances des tâches anglaises avec le point de référence MTEB.
Benchmark d’évaluation | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Moyenne MIRACL | 31,4 | 44.0 | 54.9 |
Moyenne MTEB | 61,0 | 62,3 | 64.6 |
Les modèles d’incorporation de troisième génération prennent en charge la réduction de la taille de l’incorporation via un nouveau paramètre dimensions
. En règle générale, les incorporations plus volumineuses sont plus coûteuses du point de vue du calcul, de la mémoire et du stockage. La possibilité d'ajuster le nombre de dimensions permet de mieux contrôler le coût global et les performances. Le paramètre dimensions
n’est pas pris en charge dans toutes les versions de la bibliothèque Python OpenAI 1.x. Pour tirer parti de ce paramètre, nous vous recommandons de procéder à la mise à niveau vers la dernière version : pip install openai --upgrade
.
Le test de référence MTEB d’OpenAI a révélé que même lorsque les dimensions du troisième modèle de génération sont réduites à moins de text-embeddings-ada-002
1 536 dimensions, les performances restent légèrement meilleures.
DALL-E
Les modèles DALL-E génèrent des images à partir d'invites textuelles fournies par l'utilisateur. DALL-E 3 est généralement disponible pour être utilisé avec les API REST. DALL-E 2 et DALL-E 3 avec les SDK clients sont en préversion.
Whisper
Les modèles Whisper peuvent être utilisés pour la reconnaissance vocale.
Vous pouvez également utiliser le modèle Whisper via l’API de transcription par lots d’Azure AI Speech. Découvrez Qu'est-ce que le modèle Whisper ? pour en savoir plus sur quand utiliser Azure AI Speech par rapport à Azure OpenAI Service.
Synthèse vocale (Préversion)
Les modèles de synthèse vocale OpenAI, actuellement en préversion, peuvent être utilisés pour convertir du texte par synthèse vocale.
Vous pouvez également utiliser les voix de synthèse vocale OpenAI via Azure AI Speech. Pour plus d’informations, consultez le guide Synthèse vocale OpenAI via Azure OpenAI Service ou via Azure AI Speech.
Tableau récapitulatif des modèles et de leur disponibilité par région
Remarque
Cet article couvre seulement la disponibilité des modèles/régions qui s’applique à tous les clients Azure OpenAI avec des types de déploiement Standard. Certains clients sélectionnés ont accès à des combinaisons de modèles/régions qui ne sont pas listées dans le tableau unifié ci-dessous. Ces tableaux ne s’appliquent pas non plus aux clients qui utilisent seulement des types de déploiement provisionnés qui ont leur propre matrice de disponibilité de modèles/régions. Pour plus d’informations sur les déploiements provisionnés, consultez notre Aide sur les déploiements provisionnés.
Disponibilité du modèle de déploiement standard
Région | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | whisper, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
centre de la suède | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
suisse nord | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Ce tableau n’inclut pas la disponibilité régionale du réglage précis. Pour obtenir des informations à son sujet, consultez la section relative au réglage précis dédiée.
Quota du modèle de déploiement standard
Le quota par défaut pour les modèles varie selon le modèle et la région. Les limites de quota par défaut sont susceptibles d’être modifiées.
Le quota pour les déploiements standard est décrit en termes de jetons par minute (TPM).
Région | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 K | 60 K | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
centre de la suède | 40 K | 80 K | 150 K | 30 000 | 300 K | 240 K | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
suisse nord | 40 K | 80 K | - | 30 000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1 000 jetons par minute (TPM). La relation entre TPM et Demandes par minute (RPM) est actuellement définie comme 6 RPM pour 1 000 TPM.
Modèles en préversion GPT-4 et GPT-4 Turbo
GPT-4, GPT-4-32k et GPT-4 Turbo avec Vision sont désormais disponibles pour tous les clients d’Azure OpenAI Service. La disponibilité varie selon la région. Si vous ne voyez pas GPT-4 dans votre région, veuillez réessayer ultérieurement.
Ces modèles peuvent être utilisés uniquement avec l’API d’achèvement de conversation.
GPT-4 version 0314 est la première version du modèle publiée. La version 0613 est la deuxième version du modèle et ajoute la prise en charge de l’appel de fonction.
Consultez les versions de modèle pour en savoir plus sur la façon dont Azure OpenAI Service gère les mises à niveau des versions de modèle et travailler avec des modèles pour découvrir comment afficher et configurer les paramètres de version du modèle de vos déploiements GPT-4.
Remarque
La version 0314
de gpt-4
et gpt-4-32k
sera mise hors service au plus tôt le 5 juillet 2024. La version 0613
de gpt-4
et gpt-4-32k
sera mise hors service au plus tôt le 30 septembre 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.
GPT-4 version 0125-preview est une version mise à jour de la préversion GPT-4 Turbo précédemment publiée en tant que version 1106-preview. GPT-4 version 0125-preview effectue des tâches telles que la génération de code de manière plus complète que la version gpt-4-1106-preview. En conséquence, les clients peuvent trouver que, selon la tâche, GPT-4-0125-preview génère plus de sortie que gpt-4-1106-preview. Nous recommandons aux clients de comparer les sorties du nouveau modèle. GPT-4-0125-preview corrige également les bogues de gpt-4-1106-preview en proposant la gestion UTF-8 pour les autres langues que l'anglais.
Important
gpt-4
les versions 1106-Preview et 0125-Preview seront mises à niveau avec une version stable degpt-4
dans le futur. La mise à niveau du déploiement degpt-4
1106-Preview versgpt-4
0125-Preview planifiée pour le 8 mars 2024 n’a plus lieu. Les déploiements des versionsgpt-4
1106-Preview et 0125-Preview définis sur « Mise à jour automatique par défaut » et « Mise à niveau en cas d’expiration » commenceront à être mis à niveau après la publication de la version stable. Pour chaque déploiement, une mise à niveau de la version du modèle a lieu sans interruption du service pour les appels d'API. Les mises à jour sont échelonnées par région et le processus complet de mise à jour devrait prendre 2 semaines. Les déploiements desgpt-4
versions 1106-Preview et 0125-Preview définis sur « Aucune mise à niveau automatique » ne seront pas mis à niveau et cesseront de fonctionner lorsque la préversion est mise à niveau dans la région.
ID de modèle | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|
gpt-4 (0314) |
8 192 | Septembre 2021 |
gpt-4-32k (0314) |
32,768 | Septembre 2021 |
gpt-4 (0613) |
8 192 | Septembre 2021 |
gpt-4-32k (0613) |
32,768 | Septembre 2021 |
gpt-4 (1106-Preview)1Préversion de GPT-4 Turbo |
Entrée : 128 000 Sortie : 4 096 |
avril 2023 |
gpt-4 (0125-Preview)1Préversion de GPT-4 Turbo |
Entrée : 128 000 Sortie : 4 096 |
Déc. 2023 |
gpt-4 (vision-préversion)2GPT-4 Turbo avec Vision Préversion |
Entrée : 128 000 Sortie : 4 096 |
avril 2023 |
1 Préversion de GPT-4 Turbo = gpt-4
(0125-Preview) ou gpt-4
(1106-Preview). Pour déployer ce modèle, sous Déploiements, sélectionnez un modèle gpt-4. Comme version, sélectionnez (0125-Preview) ou (1106-Preview).
2 GPT-4 Turbo avec Vision Préversion = gpt-4
(vision-préversion). Pour déployer ce modèle, sous Déploiements, sélectionnez un modèle gpt-4. Pour la version du modèle, sélectionnez vision-préversion.
Attention
Nous vous déconseillons d’utiliser des modèles de préversion en production. Nous mettrons à niveau tous les déploiements de modèles en préversion vers les versions préliminaires ultérieures et une version stable. La préversion désignée des modèles ne suit pas le cycle de vie du modèle Azure OpenAI standard.
Remarque
Les régions où GPT-4 (0314) et (0613) sont répertoriés comme disponibles ont accès aux versions 8K et 32K du modèle
Disponibilité du modèle en préversion GPT-4 et GPT-4 Turbo
Régions de cloud public
Région | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
eastus | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
southcentralus | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
centre de la suède | ✅ | ✅ | - | ✅ | ✅ |
suisse nord | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | ✅ | - | - |
westus | - | ✅ | - | ✅ | - |
Accès de clients sélectionnés
Outre les régions ci-dessus qui sont disponibles pour tous les clients Azure OpenAI, certains clients préexistants sélectionnés ont été autorisés à accéder aux versions de GPT-4 dans des régions supplémentaires :
Modèle | Région |
---|---|
gpt-4 (0314) |
USA Est France Centre États-Unis - partie centrale méridionale Sud du Royaume-Uni |
gpt-4 (0613) |
USA Est USA Est 2 Japon Est Sud du Royaume-Uni |
Régions Azure Government
Les modèles GPT-4 suivants sont disponibles avec Azure Government :
ID de modèle | Disponibilité du modèle |
---|---|
gpt-4 (1106-Preview) |
Gouvernement américain - Virginie Gouvernement des États-Unis – Arizona |
Modèles GPT-3.5
Important
Le nouveau modèle gpt-35-turbo (0125)
présente différentes améliorations, notamment une précision plus élevée pour répondre aux formats demandés et un correctif pour un bogue qui a provoqué un problème d’encodage de texte pour les appels de fonction de langue autre que l’anglais.
GPT-3.5 Turbo est utilisé avec l’API de saisie semi-automatique de conversation. GPT-3.5 Turbo version 0301 peut également être utilisé avec l’API d’achèvement, bien que cela ne soit pas recommandé. GPT-3.5 Turbo versions 0613 et 1106 ne prennent en charge que l’API de saisie semi-automatique de conversation.
GPT-3.5 Turbo version 0301 est la première version du modèle publiée. La version 0613 est la deuxième version du modèle et ajoute la prise en charge de l’appel de fonction.
Consultez les versions de modèle pour en savoir plus sur la façon dont Azure OpenAI Service gère les mises à niveau des versions de modèle et travailler avec des modèles pour découvrir comment afficher et configurer les paramètres de version du modèle de vos déploiements GPT-3.5 Turbo.
Remarque
La version 0613
de gpt-35-turbo
et gpt-35-turbo-16k
sera mise hors service au plus tôt le 1er août 2024. La version 0301
de gpt-35-turbo
sera mise hors service au plus tôt le 1er août 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.
ID de modèle | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|
gpt-35-turbo 1 (0301) |
4 096 | Septembre 2021 |
gpt-35-turbo (0613) |
4 096 | Septembre 2021 |
gpt-35-turbo-16k (0613) |
16 384 | Septembre 2021 |
gpt-35-turbo-instruct (0914) |
4 097 | Septembre 2021 |
gpt-35-turbo (1106) |
Entrée : 16 385 Sortie : 4 096 |
Septembre 2021 |
gpt-35-turbo (0125) NOUVEAU |
Entrée : 16 385 Sortie : 4 096 |
Septembre 2021 |
Disponibilité du modèle GPT-3.5-Turbo
Régions de cloud public
Région | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
centre de la suède | - | ✅ | ✅ | - | ✅ | ✅ |
suisse nord | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Ce modèle accepte 4 096 jetons > des requêtes. Il n’est pas recommandé de dépasser la limite de 4 096 jetons d’entrée, car la version la plus récente du modèle est limitée à 4 096 jetons. Si vous rencontrez des problèmes lorsque vous excédez 4 096 jetons d’entrée avec ce modèle, cette configuration n’est pas officiellement prise en charge.
Régions Azure Government
Les modèles GPT-3.5 turbo suivants sont disponibles avec Azure Government :
ID de modèle | Disponibilité du modèle |
---|---|
gpt-35-turbo (1106-Preview) |
US Gov Virginie |
Modèles Incorporations
Ces modèles peuvent être utilisés uniquement avec des demandes d’API d’incorporation.
Remarque
text-embedding-3-large
est le modèle incorporé le plus récent et le plus capable. La mise à niveau entre les modèles d’incorporation n’est pas possible. Pour migrer à partir de l’utilisation de text-embedding-ada-002
vers text-embedding-3-large
vous devez générer de nouvelles incorporations.
ID de modèle | Nbre max. de requêtes (jetons) | Dimensions de sortie | Données d’apprentissage (jusqu’à) |
---|---|---|---|
text-embedding-ada-002 (version 2) |
8 191 | 1 536 | Septembre 2021 |
text-embedding-ada-002 (version 1) |
2 046 | 1 536 | Septembre 2021 |
text-embedding-3-large |
8 191 | 3 072 | Septembre 2021 |
text-embedding-3-small |
8 191 | 1 536 | Septembre 2021 |
Remarque
Lors de l’envoi d’un tableau d’entrées pour l’incorporation, le nombre maximal d’éléments d’entrée dans le tableau par appel au point de terminaison d’incorporation est de 2048.
Régions de cloud public
Région | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
centre de la suède | - | ✅ | - | - |
suisse nord | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Régions Azure Government
Les modèles d’incorporation suivants sont disponibles avec Azure Government :
ID de modèle | Disponibilité du modèle |
---|---|
text-embedding-ada-002 (version 2) |
Gouvernement américain - Virginie Gouvernement des États-Unis – Arizona |
Modèles DALL-E
ID de modèle | Disponibilité des fonctionnalités | Requête maximale (caractères) |
---|---|---|
dalle2 (aperçu) | USA Est | 1 000 |
dall-e-3 | Est des États-Unis, Australie Est, Suède Centre | 4 000 |
Réglage des modèles
babbage-002
et davinci-002
ne sont pas formés pour suivre les instructions. L’interrogation de ces modèles de base ne doit être effectuée qu’en tant que point de référence à une version affinée pour évaluer la progression de votre formation.
gpt-35-turbo
: le réglage précis de ce modèle est limité à un sous-ensemble de régions et n’est pas disponible dans chaque région où le modèle de base est disponible.
ID de modèle | Régions pour optimisation | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|---|
babbage-002 |
Centre-Nord des États-Unis Suède Centre Suisse Ouest |
16 384 | Septembre 2021 |
davinci-002 |
Centre-Nord des États-Unis Suède Centre Suisse Ouest |
16 384 | Septembre 2021 |
gpt-35-turbo (0613) |
USA Est 2 Centre-Nord des États-Unis Suède Centre Suisse Ouest |
4 096 | Septembre 2021 |
gpt-35-turbo (1106) |
USA Est 2 Centre-Nord des États-Unis Suède Centre Suisse Ouest |
Entrée : 16 385 Sortie : 4 096 |
Septembre 2021 |
gpt-35-turbo (0125) |
USA Est 2 Centre-Nord des États-Unis Suède Centre Suisse Ouest |
16,385 | Septembre 2021 |
Modèles Whisper
ID de modèle | Disponibilité du modèle | Nombre maximal de requêtes (taille de fichier audio) |
---|---|---|
whisper |
USA Est 2 Centre-Nord des États-Unis Norvège Est Inde Sud Suède Centre Europe Ouest |
25 Mo |
Modèles de synthèse vocale (préversion)
ID de modèle | Disponibilité du modèle |
---|---|
tts-1 |
Centre-Nord des États-Unis Suède Centre |
tts-1-hd |
Centre-Nord des États-Unis Suède Centre |
Assistants (préversion)
Pour les Assistants, vous avez besoin d’une combinaison d’un modèle et d’une région tous les deux pris en charge. Certains outils et certaines fonctionnalités nécessitent les derniers modèles. Les modèles suivants sont disponibles dans l’API Assistants, le Kit de développement logiciel (SDK), Azure AI Studio et Azure OpenAI Studio. Le tableau suivant concerne le paiement à l’utilisation. Pour plus d’informations sur la disponibilité des unités de débit provisionnées (PTU), consultez Débit provisionné.
Région | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Australie Est | ✅ | ✅ | ✅ | ✅ | |
USA Est | ✅ | ✅ | |||
USA Est 2 | ✅ | ✅ | ✅ | ||
France Centre | ✅ | ✅ | ✅ | ✅ | |
Norvège Est | ✅ | ||||
Suède Centre | ✅ | ✅ | ✅ | ✅ | |
Sud du Royaume-Uni | ✅ | ✅ | ✅ | ✅ |