Modelos de Azure OpenAI Service
Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.
Modelos | Descripción |
---|---|
GPT-4 | Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código. |
GPT-3.5 | Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código. |
Incrustraciones | Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto. |
DALL-E | Una serie de modelos que pueden generar imágenes originales a partir de lenguaje natural. |
Whisper | Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto. |
Texto a voz (versión preliminar) | Una serie de modelos en versión preliminar que pueden sintetizar la conversión de texto a voz. |
Versión preliminar de GPT-4 y GPT-4 Turbo
GPT-4 es un modelo multimodal grande (acepta entradas de texto o imagen y genera texto) que puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo, GPT-4 está optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. Use la API de finalizaciones de chat para usar GPT-4. Para obtener más información sobre cómo interactuar con GPT-4 y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.
GPT-4 Turbo con Vision es la versión de GPT-4 que acepta entradas de imagen. Está disponible como el modelo vision-preview
de gpt-4
.
gpt-4
gpt-4-32k
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
GPT-3.5
Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003
que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.
Inserciones
text-embedding-3-large
es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para pasar de usar text-embedding-ada-002
a text-embedding-3-large
, tendría que generar nuevas inserciones.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
En las pruebas, OpenAI informa de los modelos de inserción de tercera generación tanto grandes como pequeños que ofrecen un mejor rendimiento medio de recuperación de varios lenguajes con el punto de referencia MIRACL, a la vez que mantiene el rendimiento de las tareas en inglés con el punto de referencia MTEB.
Punto de referencia de la evaluación | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Promedio de MIRACL | 31,4 | 44,0 | 54.9 |
Promedio de MTEB | 61,0 | 62,3 | 64,6 |
Los modelos de inserción de tercera generación admiten reducir el tamaño de la inserción mediante un nuevo parámetro dimensions
. Normalmente, las inserciones más grandes son más costosas desde una perspectiva de proceso, memoria y almacenamiento. La capacidad de ajustar el número de dimensiones permite un mayor control sobre el costo general y el rendimiento. El parámetro dimensions
no se admite en todas las versiones de la biblioteca de Python de OpenAI 1.x; para aprovechar este parámetro, se recomienda actualizar a la versión más reciente: pip install openai --upgrade
.
Las pruebas del punto de referencia MTEB de OpenAI han detectado que, incluso cuando las dimensiones del modelo de tercera generación se reducen a menos de text-embeddings-ada-002
1536 dimensiones, el rendimiento sigue siendo ligeramente mejor.
DALL-E
Los modelos DALL-E generan imágenes a partir de mensajes de texto que proporciona el usuario. DALL-E 3 está disponible con carácter general para su uso con las API REST. DALL-E 2 y DALL-E 3 con SDK de cliente están en versión preliminar.
Whisper
Los modelos de Susurro se pueden usar para la conversión de voz en texto.
También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.
Texto a voz (versión preliminar)
Los modelos de texto a voz de OpenAI, actualmente en versión preliminar, se pueden usar para sintetizar texto a voz.
También puede usar las voces de texto a voz de OpenAI a través de Voz de Azure AI. Para obtener más información, consulte la guía Voces de texto a voz de OpenAI mediante Azure OpenAI Service o Voz de Azure AI.
Tabla de resumen de los modelos y disponibilidad por región
Nota:
En este artículo solo se trata la disponibilidad del modelo o región que se aplica a todos los clientes de Azure OpenAI con tipos de implementación de Estándar. Algunos clientes seleccionados tienen acceso a combinaciones de modelos o regiones que no aparecen en la tabla unificada siguiente. Estas tablas tampoco se aplican a los clientes que usan solo los tipos de implementación Aprovisionados que tienen su propia matriz de disponibilidad de región o modelo único. Para obtener más información sobre las implementaciones Aprovisionadas, consulte nuestra Guía aprovisionada.
Disponibilidad del modelo de implementación estándar
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
babbage-002 , 1 |
dall-e-3 , 3.0 |
davinci-002 , 1 |
tts , 001 |
tts-hd , 001 |
whisper , 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
estado | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
suecia central | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norte de suiza | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Esta tabla no incluye la disponibilidad regional del ajuste preciso; consulte la sección dedicada al ajuste preciso para obtener esta información.
Cuota de modelo de implementación estándar
La cuota predeterminada de los modelos varía según el modelo y la región. Los límites de cuota predeterminados están sujetos a cambios.
La cuota de las implementaciones estándar se describe en términos de tokens por minuto (TPM).
Region | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 000 | 80 000 | 80 000 | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
canadaeast | 40 000 | 80 000 | 80 000 | - | 300 000 | - | 350 000 | 350 000 | 350 000 | - | - | - | - | - | - | - |
estado | - | - | 80 000 | - | 240 000 | 240 000 | 240 000 | 350 000 | 350 000 | - | - | - | - | - | - | - |
eastus2 | - | 80 000 | 80 000 | - | 300 000 | - | 350 000 | 350 000 | 350 000 | - | - | - | - | 250 000 | 250 000 | 250 000 |
francecentral | 20 000 | 60 000 | 80 000 | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 000 | - | 300 000 | - | 350 000 | - | - | 240 000 | 250 000 | 240 000 | 250 000 | 250 000 | 250 000 | 250 000 |
norwayeast | - | - | 150 000 | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 000 | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 000 | - | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
suecia central | 40 000 | 80 000 | 150 000 | 30 K | 300 000 | 240 000 | 350 000 | - | - | 240 000 | 250 000 | 240 000 | 250 000 | 250 000 | 250 000 | 250 000 |
norte de suiza | 40 000 | 80 000 | - | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 000 | - | 250 000 | 250 000 | 250 000 | 250 000 |
uksouth | - | - | 80 000 | - | 240 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 000 | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
1 K = 1000 tokens por minuto (TPM). La relación entre TPM y las solicitudes por minuto (RPM) se define actualmente como 6 RPM por 1000 TPM.
Versión preliminar de los modelos GPT-4 y GPT-4 Turbo
GPT-4, GPT-4-32k y GPT-4 Turbo con Vision ya están disponibles para todos los clientes de Azure OpenAI Service. La disponibilidad varía según la región. Si no encuentra GPT-4 en su región, vuelva a comprobarlo más tarde.
Estos modelos solo se pueden usar con la API de finalización de chat.
GPT-4 versión 0314 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.
Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.
Nota:
La versión 0314
de gpt-4
y gpt-4-32k
se retirará no antes del 5 de julio de 2024. La versión 0613
de gpt-4
y gpt-4-32k
se retirará no antes del 30 de septiembre de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
GPT-4 versión 0125-preview es una versión actualizada de la versión preliminar GPT-4 Turbo publicada anteriormente como versión 1106-preview. GPT-4 versión 0125-preview completa tareas como la generación de código más completamente en comparación con gpt-4-1106-preview. Debido a esto, dependiendo de la tarea, los clientes pueden encontrar que GPT-4-0125-preview genera más salida en comparación con gpt-4-1106-preview. Se recomienda que los clientes comparen las salidas del nuevo modelo. GPT-4-0125-preview también soluciona errores en gpt-4-1106-preview con control UTF-8 para idiomas distintos del inglés.
Importante
- Las versiones de
gpt-4
1106-Preview y 0125-Preview se actualizarán con una versión estable degpt-4
en el futuro. La actualización de implementación degpt-4
1106-Preview agpt-4
0125-Preview programada para el 8 de marzo de 2024 ya no se producirá. Las implementaciones de las versiones degpt-4
1106-Preview y 0125-Preview establecidas en "Actualización automática a predeterminada" y "Actualizar cuando haya expirado" comenzarán a actualizarse después de que se publique la versión estable. Para cada implementación, se realiza una actualización de la versión del modelo sin interrupciones en el servicio para las llamadas API. Las actualizaciones se llevan a cabo por región y se espera que el proceso de actualización completo tarde 2 semanas. Las implementaciones de las versiones degpt-4
1106-Preview y 0125-Preview establecidas en "No actualizar automáticamente" no se actualizarán y dejarán de funcionar cuando se actualice la versión preliminar en la región.
Id. de modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|
gpt-4 (0314) |
8192 | Septiembre de 2021 |
gpt-4-32k (0314) |
32 768 | Septiembre de 2021 |
gpt-4 (0613) |
8192 | Septiembre de 2021 |
gpt-4-32k (0613) |
32 768 | Septiembre de 2021 |
gpt-4 (1106-Preview)1GPT-4 Turbo versión preliminar |
Entrada: 128 000 Salida: 4096 |
Abril de 2023 |
gpt-4 (0125-Preview)1GPT-4 Turbo versión preliminar |
Entrada: 128 000 Salida: 4096 |
Dic. de 2023 |
gpt-4 (vision-preview)2GPT-4 Turbo con Vision (versión preliminar) |
Entrada: 128 000 Salida: 4096 |
Abril de 2023 |
1 GPT-4 Turbo Preview = gpt-4
(0125-Preview) o gpt-4
(1106-Preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. En versión, seleccione (0125-Preview) o (1106-Preview).
2 GPT-4 Turbo con Vision (versión preliminar) = gpt-4
(vision-preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione vision-preview.
Precaución
No se recomienda usar modelos de versión preliminar en producción. Actualizaremos todas las implementaciones de modelos de versión preliminar a versiones preliminares futuras y a una versión estable. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.
Nota:
Las regiones en las que GPT-4 (0314) y (0613) aparezca como disponible siempre tendrán acceso a las versiones de 8K y 32K del modelo
Disponibilidad la versión preliminar del modelo GPT-4 y GPT-4 Turbo
Regiones de la nube pública
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
estado | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
southcentralus | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
suecia central | ✅ | ✅ | - | ✅ | ✅ |
norte de suiza | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - |
Selección del acceso al cliente
Además de las regiones anteriores que están disponibles para todos los clientes de Azure OpenAI, a algunos clientes ya existentes se les ha concedido acceso a las versiones de GPT-4 en regiones adicionales:
Modelo | Region |
---|---|
gpt-4 (0314) |
Este de EE. UU. Centro de Francia Centro-sur de EE. UU. Sur de Reino Unido |
gpt-4 (0613) |
Este de EE. UU. Este de EE. UU. 2 Japón Oriental Sur de Reino Unido 2 |
Regiones de Azure Government
Los siguientes modelos GPT-4 están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
gpt-4 (1106-Preview) |
US Gov - Virginia US Gov: Arizona |
Modelos GPT-3.5
Importante
El NUEVO modelo gpt-35-turbo (0125)
tiene varias mejoras, incluida una mayor precisión a la hora de responder en los formatos solicitados y una corrección de un error que provocó un problema de codificación de texto para las llamadas a funciones de idioma no inglés.
GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo, versión 0301, también se puede usar con la API de finalizaciones. GPT3.3.5 Turbo, versiones 0613 y 1106 solo admite la API de finalizaciones de chat.
GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.
Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.
Nota:
La versión 0613
de gpt-35-turbo
y gpt-35-turbo-16k
se retirará no antes del 13 de julio de 2024. La versión 0301
de gpt-35-turbo
se retirará antes del 13 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
Id. de modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|
gpt-35-turbo 1 (0301) |
4 096 | Septiembre de 2021 |
gpt-35-turbo (0613) |
4 096 | Septiembre de 2021 |
gpt-35-turbo-16k (0613) |
16 384 | Septiembre de 2021 |
gpt-35-turbo-instruct (0914) |
4097 | Septiembre de 2021 |
gpt-35-turbo (1106) |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
gpt-35-turbo (0125) NUEVO |
16 385 | Septiembre de 2021 |
Disponibilidad del modelo GPT-3.5-Turbo
Regiones de la nube pública
Region |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
estado | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
suecia central | - | ✅ | ✅ | - | ✅ | ✅ |
norte de suiza | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Este modelo aceptará solicitudes > de 4096 tokens. No se recomienda superar el límite de 4096 tokens de entrada, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.
Regiones de Azure Government
Los siguientes modelos GPT-3.5 turbo están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
gpt-35-turbo (1106-Preview) |
US Gov - Virginia |
Modelos de incrustación
Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.
Nota:
text-embedding-3-large
es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para migrar de usar text-embedding-ada-002
a text-embedding-3-large
, tendría que generar nuevas inserciones.
Id. de modelo | Solicitud máxima (tokens) | Dimensiones de salida | Datos de entrenamiento (hasta) |
---|---|---|---|
text-embedding-ada-002 (versión 2) |
8191 | 1536 | Septiembre de 2021 |
text-embedding-ada-002 (versión 1) |
2046 | 1536 | Septiembre de 2021 |
text-embedding-3-large |
8191 | 3072 | Septiembre de 2021 |
text-embedding-3-small |
8191 | 1536 | Septiembre de 2021 |
Nota:
Al enviar una matriz de entradas para la inserción, el número máximo de elementos de entrada de la matriz por llamada al punto de conexión de inserción es 2048.
Regiones de la nube pública
Region |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
estado | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
suecia central | - | ✅ | - | - |
norte de suiza | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Regiones de Azure Government
Los siguientes modelos de incrustación están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
text-embedding-ada-002 (versión 2) |
US Gov - Virginia US Gov: Arizona |
Modelos DALL-E
Id. de modelo | Disponibilidad de características | Solicitud máxima (caracteres) |
---|---|---|
dalle2 (versión preliminar) | Este de EE. UU. | 1,000 |
dall-e-3 | Este de EE. UU., Este de Australia, Centro de Suecia | 4\.000 |
Ajuste de modelos
babbage-002
y davinci-002
no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.
gpt-35-turbo
: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.
Id. de modelo | Regiones de ajuste | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|---|
babbage-002 |
Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 384 | Septiembre de 2021 |
davinci-002 |
Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 384 | Septiembre de 2021 |
gpt-35-turbo (0613) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
4 096 | Septiembre de 2021 |
gpt-35-turbo (1106) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
gpt-35-turbo (0125) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 385 | Septiembre de 2021 |
Modelos de Whisper
Id. de modelo | Disponibilidad del modelo | Solicitud máxima (tamaño de archivo de audio) |
---|---|---|
whisper |
Este de EE. UU. 2 Centro-Norte de EE. UU Este de Noruega Sur de la India Centro de Suecia Oeste de Europa |
25 MB |
Modelos de texto a voz (versión preliminar)
Id. de modelo | Disponibilidad del modelo |
---|---|
tts-1 |
Centro-Norte de EE. UU Centro de Suecia |
tts-1-hd |
Centro-Norte de EE. UU Centro de Suecia |
Asistentes (versión preliminar)
Para Asistentes se necesita una combinación de un modelo compatible y una región compatible. Algunas herramientas y funcionalidades requieren los modelos más recientes. Los siguientes modelos están disponibles en la API de asistentes, el SDK, Inteligencia artificial de Azure Studio y Azure OpenAI Studio. La tabla siguiente es para pago por uso. Para obtener información sobre la disponibilidad de la unidad de rendimiento aprovisionada (PTU), consulte rendimiento aprovisionado.
Region | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Este de Australia | ✅ | ✅ | ✅ | ✅ | |
Este de EE. UU. | ✅ | ✅ | |||
Este de EE. UU. 2 | ✅ | ✅ | ✅ | ||
Centro de Francia | ✅ | ✅ | ✅ | ✅ | |
Este de Noruega | ✅ | ||||
Centro de Suecia | ✅ | ✅ | ✅ | ✅ | |
Sur de Reino Unido 2 | ✅ | ✅ | ✅ | ✅ |