Modelos de Azure OpenAI Service

Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.

Modelos Descripción
GPT-4 Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código.
GPT-3.5 Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código.
Incrustraciones Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto.
DALL-E (versión preliminar) Una serie de modelos en versión preliminar que pueden generar imágenes originales a partir de lenguaje natural.
Whisper (versión preliminar) Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto.

Versión preliminar de GPT-4 y GPT-4 Turbo

GPT-4 puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo, GPT-4 está optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. Use la API de finalizaciones de chat para usar GPT-4. Para obtener más información sobre cómo interactuar con GPT-4 y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.

  • gpt-4
  • gpt-4-32k

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

GPT-3.5

Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003 que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.

Inserciones

Importante

Se recomienda encarecidamente usar text-embedding-ada-002 (Version 2). Este modelo o versión proporciona paridad con text-embedding-ada-002 de OpenAI. Para obtener más información sobre las mejoras que ofrece este modelo, consulte la entrada de blog de OpenAI. Incluso si actualmente usa la versión 1, deberá migrar a la versión 2 para aprovechar las últimas ponderaciones o actualizaciones más recientes del límite de token. La versión 1 y la versión 2 no son intercambiables, por lo que la inserción de documentos y la búsqueda de documentos deberán realizarse con la misma versión del modelo.

Los modelos de inclusión anteriores se han consolidado en este nuevo modelo de reemplazo:

text-embedding-ada-002

DALL-E (versión preliminar)

Los modelos DALL-E, actualmente en versión preliminar, generan imágenes a partir de mensajes de texto que proporciona el usuario.

Whisper (versión preliminar)

Los modelos de Whisper, actualmente en versión preliminar, se pueden usar para la conversión de voz en texto.

También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.

Tabla de resumen de los modelos y disponibilidad por región

Importante

Debido a una alta demanda:

  • Centro-sur de EE. UU. no está disponible temporalmente para crear nuevos recursos e implementaciones.

Versión preliminar de los modelos GPT-4 y GPT-4 Turbo

Los modelos GPT-4 y GPT-4-32k ya están disponibles para todos los clientes de Azure OpenAI Service. La disponibilidad varía según la región. Si no encuentra GPT-4 en su región, vuelva a comprobarlo más tarde.

Estos modelos solo se pueden usar con la API de finalización de chat.

GPT-4 versión 0314 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.

Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.

Nota:

La versión 0314 de gpt-4 y gpt-4-32k se retirará no antes del 5 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

Id. de modelo Solicitud máxima (tokens) Datos de entrenamiento (hasta)
gpt-4 (0314) 8192 Septiembre de 2021
gpt-4-32k(0314) 32 768 Septiembre de 2021
gpt-4 (0613) 8192 Septiembre de 2021
gpt-4-32k (0613) 32 768 Septiembre de 2021
gpt-4 (1106-preview)1
GPT-4-Turbo versión preliminar
Entrada: 128 000
Salida: 4096
Abril de 2023

1 GPT-4 Turbo v = gpt-4 (1106-versión preliminar). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione 1106 versión preliminar. No se recomienda usar este modelo en producción. Actualizaremos todas las implementaciones de este modelo a una versión estable futura. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.

Nota:

Las regiones en las que GPT-4 (0314) & (0613) aparezca como disponible siempre tendrán acceso a las versiones de 8K y 32K del modelo

Disponibilidad la versión preliminar del modelo GPT-4 y GPT-4 Turbo

Disponibilidad del modelo gpt-4 (0314) gpt-4 (0613) gpt-4 (1106-preview)
Disponible para todas las suscripciones con acceso a Azure OpenAI Este de Australia
Este de Canadá
Centro de Francia
Centro de Suecia
Norte de Suiza
Este de Australia
Este de Canadá
Este de EE. UU. 2
Centro de Francia
Este de Noruega
Sur de la India
Centro de Suecia
Sur de Reino Unido
Oeste de EE. UU.
Disponible para suscripciones con acceso actual a la versión del modelo en la región Este de EE. UU.
Centro de Francia
Centro-sur de EE. UU.
Sur de Reino Unido
Este de EE. UU.
Este de EE. UU. 2
Japón Oriental
Sur de Reino Unido

Modelos GPT-3.5

GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo (0301) también se puede usar con la API de finalizaciones. GPT3.5 Turbo (0613) solo admite la API de finalizaciones de chat.

GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.

Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.

Nota:

La versión 0301 de gpt-35-turbo se retirará antes del 5 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

Disponibilidad del modelo GPT-3.5-Turbo

Id. de modelo Disponibilidad del modelo Solicitud máxima (tokens) Datos de entrenamiento (hasta)
gpt-35-turbo1 (0301) Este de EE. UU.
Centro de Francia
Centro-sur de EE. UU.
Sur de Reino Unido
Oeste de Europa
4096 Septiembre de 2021
gpt-35-turbo (0613) Este de Australia
Este de Canadá
Este de EE. UU.
Este de EE. UU. 2
Centro de Francia
Japón Oriental
Centro-Norte de EE. UU
Centro de Suecia
Norte de Suiza
Sur de Reino Unido
4096 Septiembre de 2021
gpt-35-turbo-16k (0613) Este de Australia
Este de Canadá
Este de EE. UU.
Este de EE. UU. 2
Centro de Francia
Japón Oriental
Centro-Norte de EE. UU
Centro de Suecia
Norte de Suiza
Sur de Reino Unido
16 384 Septiembre de 2021
gpt-35-turbo-instruct (0914) Este de EE. UU.
Centro de Suecia
4097 Septiembre de 2021
gpt-35-turbo (1106) Este de Australia
Este de Canadá
Centro de Francia
Sur de la India
Centro de Suecia
Sur de Reino Unido
Oeste de EE. UU.
Entrada: 16 385
Salida: 4096
Septiembre de 2021

1 Este modelo aceptará solicitudes de tokens de > 4096. No se recomienda superar el límite de tokens de entrada 4096, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar los 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.

Modelos de incrustación

Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.

Nota

Se recomienda encarecidamente usar text-embedding-ada-002 (Version 2). Este modelo o versión proporciona paridad con text-embedding-ada-002 de OpenAI. Para obtener más información sobre las mejoras que ofrece este modelo, consulte la entrada de blog de OpenAI. Incluso si actualmente usa la versión 1, deberá migrar a la versión 2 para aprovechar las últimas ponderaciones o actualizaciones más recientes del límite de token. La versión 1 y la versión 2 no son intercambiables, por lo que la inserción de documentos y la búsqueda de documentos deberán realizarse con la misma versión del modelo.

Id. de modelo Disponibilidad del modelo Solicitud máxima (tokens) Datos de entrenamiento (hasta) Dimensiones de salida
text-embedding-ada-002 (versión 2) Este de Australia
Este de Canadá
Este de EE. UU.
Este de EE. UU. 2
Centro de Francia
Japón Oriental
Centro-Norte de EE. UU
Centro-sur de EE. UU.
Centro de Suecia
Norte de Suiza
Sur de Reino Unido
Oeste de Europa
8191 Septiembre de 2021 1536
text-embedding-ada-002 (versión 1) Este de EE. UU.
Centro-sur de EE. UU.
Oeste de Europa
2046 Septiembre de 2021 1536

Modelos DALL-E (versión preliminar)

Id. de modelo Disponibilidad de características Solicitud máxima (caracteres)
dalle2 Este de EE. UU. 1 000
dalle3 Centro de Suecia 4000

Modelos de ajuste preciso (versión preliminar)

babbage-002 y davinci-002 no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.

gpt-35-turbo-0613: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.

Id. de modelo Regiones de ajuste Solicitud máxima (tokens) Datos de entrenamiento (hasta)
babbage-002 Centro-Norte de EE. UU
Centro de Suecia
16 384 Septiembre de 2021
davinci-002 Centro-Norte de EE. UU
Centro de Suecia
16 384 Septiembre de 2021
gpt-35-turbo (0613) Centro-Norte de EE. UU
Centro de Suecia
4096 Septiembre de 2021

Modelos de Whisper (versión preliminar)

Id. de modelo Disponibilidad del modelo Solicitud máxima (tamaño de archivo de audio)
whisper Centro-Norte de EE. UU
Oeste de Europa
25 MB

Pasos siguientes