Modelos de Azure OpenAI Service
Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.
| Modelos | Descripción |
|---|---|
| GPT-4 | Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código. |
| GPT-3.5 | Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código. |
| Incrustraciones | Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto. |
| DALL-E (versión preliminar) | Una serie de modelos en versión preliminar que pueden generar imágenes originales a partir de lenguaje natural. |
| Whisper (versión preliminar) | Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto. |
Versión preliminar de GPT-4 y GPT-4 Turbo
GPT-4 puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo, GPT-4 está optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. Use la API de finalizaciones de chat para usar GPT-4. Para obtener más información sobre cómo interactuar con GPT-4 y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.
gpt-4gpt-4-32k
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
GPT-3.5
Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003 que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.
gpt-35-turbogpt-35-turbo-16kgpt-35-turbo-instruct
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.
Inserciones
Importante
Se recomienda encarecidamente usar text-embedding-ada-002 (Version 2). Este modelo o versión proporciona paridad con text-embedding-ada-002 de OpenAI. Para obtener más información sobre las mejoras que ofrece este modelo, consulte la entrada de blog de OpenAI. Incluso si actualmente usa la versión 1, deberá migrar a la versión 2 para aprovechar las últimas ponderaciones o actualizaciones más recientes del límite de token. La versión 1 y la versión 2 no son intercambiables, por lo que la inserción de documentos y la búsqueda de documentos deberán realizarse con la misma versión del modelo.
Los modelos de inclusión anteriores se han consolidado en este nuevo modelo de reemplazo:
text-embedding-ada-002
DALL-E (versión preliminar)
Los modelos DALL-E, actualmente en versión preliminar, generan imágenes a partir de mensajes de texto que proporciona el usuario.
Whisper (versión preliminar)
Los modelos de Whisper, actualmente en versión preliminar, se pueden usar para la conversión de voz en texto.
También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.
Tabla de resumen de los modelos y disponibilidad por región
Importante
Debido a una alta demanda:
- Centro-sur de EE. UU. no está disponible temporalmente para crear nuevos recursos e implementaciones.
Versión preliminar de los modelos GPT-4 y GPT-4 Turbo
Los modelos GPT-4 y GPT-4-32k ya están disponibles para todos los clientes de Azure OpenAI Service. La disponibilidad varía según la región. Si no encuentra GPT-4 en su región, vuelva a comprobarlo más tarde.
Estos modelos solo se pueden usar con la API de finalización de chat.
GPT-4 versión 0314 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.
Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.
Nota:
La versión 0314 de gpt-4 y gpt-4-32k se retirará no antes del 5 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
| Id. de modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
|---|---|---|
gpt-4 (0314) |
8192 | Septiembre de 2021 |
gpt-4-32k(0314) |
32 768 | Septiembre de 2021 |
gpt-4 (0613) |
8192 | Septiembre de 2021 |
gpt-4-32k (0613) |
32 768 | Septiembre de 2021 |
gpt-4 (1106-preview)1GPT-4-Turbo versión preliminar |
Entrada: 128 000 Salida: 4096 |
Abril de 2023 |
1 GPT-4 Turbo v = gpt-4 (1106-versión preliminar). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione 1106 versión preliminar. No se recomienda usar este modelo en producción. Actualizaremos todas las implementaciones de este modelo a una versión estable futura. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.
Nota:
Las regiones en las que GPT-4 (0314) & (0613) aparezca como disponible siempre tendrán acceso a las versiones de 8K y 32K del modelo
Disponibilidad la versión preliminar del modelo GPT-4 y GPT-4 Turbo
| Disponibilidad del modelo | gpt-4 (0314) | gpt-4 (0613) | gpt-4 (1106-preview) |
|---|---|---|---|
| Disponible para todas las suscripciones con acceso a Azure OpenAI | Este de Australia Este de Canadá Centro de Francia Centro de Suecia Norte de Suiza |
Este de Australia Este de Canadá Este de EE. UU. 2 Centro de Francia Este de Noruega Sur de la India Centro de Suecia Sur de Reino Unido Oeste de EE. UU. |
|
| Disponible para suscripciones con acceso actual a la versión del modelo en la región | Este de EE. UU. Centro de Francia Centro-sur de EE. UU. Sur de Reino Unido |
Este de EE. UU. Este de EE. UU. 2 Japón Oriental Sur de Reino Unido |
Modelos GPT-3.5
GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo (0301) también se puede usar con la API de finalizaciones. GPT3.5 Turbo (0613) solo admite la API de finalizaciones de chat.
GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.
Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.
Nota:
La versión 0301 de gpt-35-turbo se retirará antes del 5 de julio de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
Disponibilidad del modelo GPT-3.5-Turbo
| Id. de modelo | Disponibilidad del modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
|---|---|---|---|
gpt-35-turbo1 (0301) |
Este de EE. UU. Centro de Francia Centro-sur de EE. UU. Sur de Reino Unido Oeste de Europa |
4096 | Septiembre de 2021 |
gpt-35-turbo (0613) |
Este de Australia Este de Canadá Este de EE. UU. Este de EE. UU. 2 Centro de Francia Japón Oriental Centro-Norte de EE. UU Centro de Suecia Norte de Suiza Sur de Reino Unido |
4096 | Septiembre de 2021 |
gpt-35-turbo-16k (0613) |
Este de Australia Este de Canadá Este de EE. UU. Este de EE. UU. 2 Centro de Francia Japón Oriental Centro-Norte de EE. UU Centro de Suecia Norte de Suiza Sur de Reino Unido |
16 384 | Septiembre de 2021 |
gpt-35-turbo-instruct (0914) |
Este de EE. UU. Centro de Suecia |
4097 | Septiembre de 2021 |
gpt-35-turbo (1106) |
Este de Australia Este de Canadá Centro de Francia Sur de la India Centro de Suecia Sur de Reino Unido Oeste de EE. UU. |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
1 Este modelo aceptará solicitudes de tokens de > 4096. No se recomienda superar el límite de tokens de entrada 4096, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar los 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.
Modelos de incrustación
Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.
Nota
Se recomienda encarecidamente usar text-embedding-ada-002 (Version 2). Este modelo o versión proporciona paridad con text-embedding-ada-002 de OpenAI. Para obtener más información sobre las mejoras que ofrece este modelo, consulte la entrada de blog de OpenAI. Incluso si actualmente usa la versión 1, deberá migrar a la versión 2 para aprovechar las últimas ponderaciones o actualizaciones más recientes del límite de token. La versión 1 y la versión 2 no son intercambiables, por lo que la inserción de documentos y la búsqueda de documentos deberán realizarse con la misma versión del modelo.
| Id. de modelo | Disponibilidad del modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) | Dimensiones de salida |
|---|---|---|---|---|
text-embedding-ada-002 (versión 2) |
Este de Australia Este de Canadá Este de EE. UU. Este de EE. UU. 2 Centro de Francia Japón Oriental Centro-Norte de EE. UU Centro-sur de EE. UU. Centro de Suecia Norte de Suiza Sur de Reino Unido Oeste de Europa |
8191 | Septiembre de 2021 | 1536 |
text-embedding-ada-002 (versión 1) |
Este de EE. UU. Centro-sur de EE. UU. Oeste de Europa |
2046 | Septiembre de 2021 | 1536 |
Modelos DALL-E (versión preliminar)
| Id. de modelo | Disponibilidad de características | Solicitud máxima (caracteres) |
|---|---|---|
| dalle2 | Este de EE. UU. | 1 000 |
| dalle3 | Centro de Suecia | 4000 |
Modelos de ajuste preciso (versión preliminar)
babbage-002 y davinci-002 no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.
gpt-35-turbo-0613: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.
| Id. de modelo | Regiones de ajuste | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
|---|---|---|---|
babbage-002 |
Centro-Norte de EE. UU Centro de Suecia |
16 384 | Septiembre de 2021 |
davinci-002 |
Centro-Norte de EE. UU Centro de Suecia |
16 384 | Septiembre de 2021 |
gpt-35-turbo (0613) |
Centro-Norte de EE. UU Centro de Suecia |
4096 | Septiembre de 2021 |
Modelos de Whisper (versión preliminar)
| Id. de modelo | Disponibilidad del modelo | Solicitud máxima (tamaño de archivo de audio) |
|---|---|---|
whisper |
Centro-Norte de EE. UU Oeste de Europa |
25 MB |