Modelos de Azure OpenAI Service

Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.

Modelos Descripción
GPT-4 Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código.
GPT-3.5 Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código.
Incrustraciones Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto.
DALL-E Una serie de modelos que pueden generar imágenes originales a partir de lenguaje natural.
Whisper Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto.
Texto a voz (versión preliminar) Una serie de modelos en versión preliminar que pueden sintetizar la conversión de texto a voz.

Versión preliminar de GPT-4 y GPT-4 Turbo

GPT-4 es un modelo multimodal grande (acepta entradas de texto o imagen y genera texto) que puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo, GPT-4 está optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. Use la API de finalizaciones de chat para usar GPT-4. Para obtener más información sobre cómo interactuar con GPT-4 y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.

GPT-4 Turbo con Vision es la versión de GPT-4 que acepta entradas de imagen. Está disponible como el modelo vision-preview de gpt-4.

  • gpt-4
  • gpt-4-32k

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

GPT-3.5

Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003 que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.

Inserciones

text-embedding-3-large es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para pasar de usar text-embedding-ada-002 a text-embedding-3-large, tendría que generar nuevas inserciones.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

En las pruebas, OpenAI informa de los modelos de inserción de tercera generación tanto grandes como pequeños que ofrecen un mejor rendimiento medio de recuperación de varios lenguajes con el punto de referencia MIRACL, a la vez que mantiene el rendimiento de las tareas en inglés con el punto de referencia MTEB.

Punto de referencia de la evaluación text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Promedio de MIRACL 31,4 44,0 54.9
Promedio de MTEB 61,0 62,3 64,6

Los modelos de inserción de tercera generación admiten reducir el tamaño de la inserción mediante un nuevo parámetro dimensions. Normalmente, las inserciones más grandes son más costosas desde una perspectiva de proceso, memoria y almacenamiento. La capacidad de ajustar el número de dimensiones permite un mayor control sobre el costo general y el rendimiento. El parámetro dimensions no se admite en todas las versiones de la biblioteca de Python de OpenAI 1.x; para aprovechar este parámetro, se recomienda actualizar a la versión más reciente: pip install openai --upgrade.

Las pruebas del punto de referencia MTEB de OpenAI han detectado que, incluso cuando las dimensiones del modelo de tercera generación se reducen a menos de text-embeddings-ada-002 1536 dimensiones, el rendimiento sigue siendo ligeramente mejor.

DALL-E

Los modelos DALL-E generan imágenes a partir de mensajes de texto que proporciona el usuario. DALL-E 3 está disponible con carácter general para su uso con las API REST. DALL-E 2 y DALL-E 3 con SDK de cliente están en versión preliminar.

Whisper

Los modelos de Susurro se pueden usar para la conversión de voz en texto.

También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.

Texto a voz (versión preliminar)

Los modelos de texto a voz de OpenAI, actualmente en versión preliminar, se pueden usar para sintetizar texto a voz.

También puede usar las voces de texto a voz de OpenAI a través de Voz de Azure AI. Para obtener más información, consulte la guía Voces de texto a voz de OpenAI mediante Azure OpenAI Service o Voz de Azure AI.

Tabla de resumen de los modelos y disponibilidad por región

Nota:

En este artículo solo se trata la disponibilidad del modelo o región que se aplica a todos los clientes de Azure OpenAI con tipos de implementación de Estándar. Algunos clientes seleccionados tienen acceso a combinaciones de modelos o regiones que no aparecen en la tabla unificada siguiente. Estas tablas tampoco se aplican a los clientes que usan solo los tipos de implementación Aprovisionados que tienen su propia matriz de disponibilidad de región o modelo único. Para obtener más información sobre las implementaciones Aprovisionadas, consulte nuestra Guía aprovisionada.

Disponibilidad del modelo de implementación estándar

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
estado - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
suecia central - - - - - -
norte de suiza - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Esta tabla no incluye la disponibilidad regional del ajuste preciso; consulte la sección dedicada al ajuste preciso para obtener esta información.

Cuota de modelo de implementación estándar

La cuota predeterminada de los modelos varía según el modelo y la región. Los límites de cuota predeterminados están sujetos a cambios.

La cuota de las implementaciones estándar se describe en términos de tokens por minuto (TPM).

Region GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 000 80 000 80 000 30 K 300 000 - 350 000 - - - - - - - - -
brazilsouth - - - - - - 350 000 - - - - - - - - -
canadaeast 40 000 80 000 80 000 - 300 000 - 350 000 350 000 350 000 - - - - - - -
estado - - 80 000 - 240 000 240 000 240 000 350 000 350 000 - - - - - - -
eastus2 - 80 000 80 000 - 300 000 - 350 000 350 000 350 000 - - - - 250 000 250 000 250 000
francecentral 20 000 60 000 80 000 - 240 000 - 240 000 - - - - - - - - -
japaneast - - - 30 K 300 000 - 350 000 - - - - - - - - -
northcentralus - - 80 000 - 300 000 - 350 000 - - 240 000 250 000 240 000 250 000 250 000 250 000 250 000
norwayeast - - 150 000 - - - 350 000 - - - - - - - - -
southafricanorth - - - - - - 350 000 - - - - - - - - -
southcentralus - - 80 000 - 240 000 - 240 000 - - - - - - - - -
southindia - - 150 000 - 300 000 - 350 000 - - - - - - - - -
suecia central 40 000 80 000 150 000 30 K 300 000 240 000 350 000 - - 240 000 250 000 240 000 250 000 250 000 250 000 250 000
norte de suiza 40 000 80 000 - 30 K 300 000 - 350 000 - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 000 - 250 000 250 000 250 000 250 000
uksouth - - 80 000 - 240 000 - 350 000 - - - - - - - - -
westeurope - - - - 240 000 - 240 000 - - - - - - - - -
westus - - 80 000 30 K 300 000 - 350 000 - - - - - - - - -
westus3 - - - - - - 350 000 - - - - - - - - -

1 K = 1000 tokens por minuto (TPM). La relación entre TPM y las solicitudes por minuto (RPM) se define actualmente como 6 RPM por 1000 TPM.

Versión preliminar de los modelos GPT-4 y GPT-4 Turbo

GPT-4, GPT-4-32k y GPT-4 Turbo con Vision ya están disponibles para todos los clientes de Azure OpenAI Service. La disponibilidad varía según la región. Si no encuentra GPT-4 en su región, vuelva a comprobarlo más tarde.

Estos modelos solo se pueden usar con la API de finalización de chat.

GPT-4 versión 0314 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.

Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.

Nota:

La versión 0314 de gpt-4 y gpt-4-32k se retirará no antes del 5 de julio de 2024. La versión 0613 de gpt-4 y gpt-4-32k se retirará no antes del 30 de septiembre de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

GPT-4 versión 0125-preview es una versión actualizada de la versión preliminar GPT-4 Turbo publicada anteriormente como versión 1106-preview. GPT-4 versión 0125-preview completa tareas como la generación de código más completamente en comparación con gpt-4-1106-preview. Debido a esto, dependiendo de la tarea, los clientes pueden encontrar que GPT-4-0125-preview genera más salida en comparación con gpt-4-1106-preview. Se recomienda que los clientes comparen las salidas del nuevo modelo. GPT-4-0125-preview también soluciona errores en gpt-4-1106-preview con control UTF-8 para idiomas distintos del inglés.

Importante

  • Las versiones de gpt-4 1106-Preview y 0125-Preview se actualizarán con una versión estable de gpt-4 en el futuro. La actualización de implementación de gpt-4 1106-Preview a gpt-4 0125-Preview programada para el 8 de marzo de 2024 ya no se producirá. Las implementaciones de las versiones de gpt-4 1106-Preview y 0125-Preview establecidas en "Actualización automática a predeterminada" y "Actualizar cuando haya expirado" comenzarán a actualizarse después de que se publique la versión estable. Para cada implementación, se realiza una actualización de la versión del modelo sin interrupciones en el servicio para las llamadas API. Las actualizaciones se llevan a cabo por región y se espera que el proceso de actualización completo tarde 2 semanas. Las implementaciones de las versiones de gpt-4 1106-Preview y 0125-Preview establecidas en "No actualizar automáticamente" no se actualizarán y dejarán de funcionar cuando se actualice la versión preliminar en la región.
Id. de modelo Solicitud máxima (tokens) Datos de entrenamiento (hasta)
gpt-4 (0314) 8192 Septiembre de 2021
gpt-4-32k(0314) 32 768 Septiembre de 2021
gpt-4 (0613) 8192 Septiembre de 2021
gpt-4-32k (0613) 32 768 Septiembre de 2021
gpt-4 (1106-Preview)1
GPT-4 Turbo versión preliminar
Entrada: 128 000
Salida: 4096
Abril de 2023
gpt-4 (0125-Preview)1
GPT-4 Turbo versión preliminar
Entrada: 128 000
Salida: 4096
Dic. de 2023
gpt-4 (vision-preview)2
GPT-4 Turbo con Vision (versión preliminar)
Entrada: 128 000
Salida: 4096
Abril de 2023

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) o gpt-4 (1106-Preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. En versión, seleccione (0125-Preview) o (1106-Preview).

2 GPT-4 Turbo con Vision (versión preliminar) = gpt-4 (vision-preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione vision-preview.

Precaución

No se recomienda usar modelos de versión preliminar en producción. Actualizaremos todas las implementaciones de modelos de versión preliminar a versiones preliminares futuras y a una versión estable. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.

Nota:

Las regiones en las que GPT-4 (0314) y (0613) aparezca como disponible siempre tendrán acceso a las versiones de 8K y 32K del modelo

Disponibilidad la versión preliminar del modelo GPT-4 y GPT-4 Turbo

Regiones de la nube pública

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613
australiaeast -
canadaeast - -
estado - - - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - - -
norwayeast - - - -
southcentralus - - - -
southindia - - - -
suecia central -
norte de suiza - -
uksouth - - - -
westus - - -

Selección del acceso al cliente

Además de las regiones anteriores que están disponibles para todos los clientes de Azure OpenAI, a algunos clientes ya existentes se les ha concedido acceso a las versiones de GPT-4 en regiones adicionales:

Modelo Region
gpt-4 (0314) Este de EE. UU.
Centro de Francia
Centro-sur de EE. UU.
Sur de Reino Unido
gpt-4 (0613) Este de EE. UU.
Este de EE. UU. 2
Japón Oriental
Sur de Reino Unido 2

Regiones de Azure Government

Los siguientes modelos GPT-4 están disponibles con Azure Government:

Id. de modelo Disponibilidad del modelo
gpt-4 (1106-Preview) US Gov - Virginia
US Gov: Arizona

Modelos GPT-3.5

Importante

El NUEVO modelo gpt-35-turbo (0125) tiene varias mejoras, incluida una mayor precisión a la hora de responder en los formatos solicitados y una corrección de un error que provocó un problema de codificación de texto para las llamadas a funciones de idioma no inglés.

GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo, versión 0301, también se puede usar con la API de finalizaciones. GPT3.3.5 Turbo, versiones 0613 y 1106 solo admite la API de finalizaciones de chat.

GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.

Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.

Nota:

La versión 0613 de gpt-35-turbo y gpt-35-turbo-16k se retirará no antes del 13 de julio de 2024. La versión 0301 de gpt-35-turbo se retirará antes del 13 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

Id. de modelo Solicitud máxima (tokens) Datos de entrenamiento (hasta)
gpt-35-turbo1 (0301) 4 096 Septiembre de 2021
gpt-35-turbo (0613) 4 096 Septiembre de 2021
gpt-35-turbo-16k (0613) 16 384 Septiembre de 2021
gpt-35-turbo-instruct (0914) 4097 Septiembre de 2021
gpt-35-turbo (1106) Entrada: 16 385
Salida: 4096
Septiembre de 2021
gpt-35-turbo (0125) NUEVO 16 385 Septiembre de 2021

Disponibilidad del modelo GPT-3.5-Turbo

Regiones de la nube pública

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
estado - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
suecia central - -
norte de suiza - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Este modelo aceptará solicitudes > de 4096 tokens. No se recomienda superar el límite de 4096 tokens de entrada, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.

Regiones de Azure Government

Los siguientes modelos GPT-3.5 turbo están disponibles con Azure Government:

Id. de modelo Disponibilidad del modelo
gpt-35-turbo (1106-Preview) US Gov - Virginia

Modelos de incrustación

Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.

Nota:

text-embedding-3-large es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para migrar de usar text-embedding-ada-002 a text-embedding-3-large, tendría que generar nuevas inserciones.

Id. de modelo Solicitud máxima (tokens) Dimensiones de salida Datos de entrenamiento (hasta)
text-embedding-ada-002 (versión 2) 8191 1536 Septiembre de 2021
text-embedding-ada-002 (versión 1) 2046 1536 Septiembre de 2021
text-embedding-3-large 8191 3072 Septiembre de 2021
text-embedding-3-small 8191 1536 Septiembre de 2021

Nota:

Al enviar una matriz de entradas para la inserción, el número máximo de elementos de entrada de la matriz por llamada al punto de conexión de inserción es 2048.

Regiones de la nube pública

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
estado
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
suecia central - - -
norte de suiza - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Regiones de Azure Government

Los siguientes modelos de incrustación están disponibles con Azure Government:

Id. de modelo Disponibilidad del modelo
text-embedding-ada-002 (versión 2) US Gov - Virginia
US Gov: Arizona

Modelos DALL-E

Id. de modelo Disponibilidad de características Solicitud máxima (caracteres)
dalle2 (versión preliminar) Este de EE. UU. 1,000
dall-e-3 Este de EE. UU., Este de Australia, Centro de Suecia 4\.000

Ajuste de modelos

babbage-002 y davinci-002 no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.

gpt-35-turbo: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.

Id. de modelo Regiones de ajuste Solicitud máxima (tokens) Datos de entrenamiento (hasta)
babbage-002 Centro-Norte de EE. UU
Centro de Suecia
Oeste de Suiza
16 384 Septiembre de 2021
davinci-002 Centro-Norte de EE. UU
Centro de Suecia
Oeste de Suiza
16 384 Septiembre de 2021
gpt-35-turbo (0613) Este de EE. UU. 2
Centro-Norte de EE. UU
Centro de Suecia
Oeste de Suiza
4 096 Septiembre de 2021
gpt-35-turbo (1106) Este de EE. UU. 2
Centro-Norte de EE. UU
Centro de Suecia
Oeste de Suiza
Entrada: 16 385
Salida: 4096
Septiembre de 2021
gpt-35-turbo (0125) Este de EE. UU. 2
Centro-Norte de EE. UU
Centro de Suecia
Oeste de Suiza
16 385 Septiembre de 2021

Modelos de Whisper

Id. de modelo Disponibilidad del modelo Solicitud máxima (tamaño de archivo de audio)
whisper Este de EE. UU. 2
Centro-Norte de EE. UU
Este de Noruega
Sur de la India
Centro de Suecia
Oeste de Europa
25 MB

Modelos de texto a voz (versión preliminar)

Id. de modelo Disponibilidad del modelo
tts-1 Centro-Norte de EE. UU
Centro de Suecia
tts-1-hd Centro-Norte de EE. UU
Centro de Suecia

Asistentes (versión preliminar)

Para Asistentes se necesita una combinación de un modelo compatible y una región compatible. Algunas herramientas y funcionalidades requieren los modelos más recientes. Los siguientes modelos están disponibles en la API de asistentes, el SDK, Inteligencia artificial de Azure Studio y Azure OpenAI Studio. La tabla siguiente es para pago por uso. Para obtener información sobre la disponibilidad de la unidad de rendimiento aprovisionada (PTU), consulte rendimiento aprovisionado.

Region gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Este de Australia
Este de EE. UU.
Este de EE. UU. 2
Centro de Francia
Este de Noruega
Centro de Suecia
Sur de Reino Unido 2

Pasos siguientes