Compartir a través de


Desuso y retiradas del modelo de Azure OpenAI Service

Información general

Los modelos de Azure OpenAI Service se actualizan continuamente con modelos más recientes y compatibles. Como parte de este proceso, dejamos de usar y retiramos modelos más antiguos. En este documento se proporciona información sobre los modelos que están disponibles actualmente, en desuso y retirados.

Terminología

  • Retirado
    • Cuando se retira un modelo, ya no está disponible para su uso. Las implementaciones del Azure OpenAI Service de un modelo retirado siempre devuelven respuestas de error.
  • Desuso
    • Cuando un modelo está en desuso, ya no está disponible para los nuevos clientes. Sigue estando disponible para su uso por parte de los clientes con implementaciones existentes hasta que se retire el modelo.

Notificaciones

Azure OpenAI notifica a los clientes de implementaciones activas de Azure OpenAI Service para los modelos con próximas retiradas. Notificamos a los clientes las próximas retiradas como se indica a continuación para cada implementación:

  1. En el lanzamiento del modelo, designamos mediante programación una fecha de retirada "no antes de" (normalmente un año de espera).
  2. Notificar al menos 60 días antes de la retirada del modelo para los modelos disponibles con carácter general (GA).
  3. Al menos 30 días de aviso antes de las actualizaciones de la versión preliminar del modelo.

Las retiradas se realizan de forma gradual, región por región.

Disponibilidad del modelo

  1. Al menos un año de disponibilidad del modelo para los modelos de disponibilidad general después de la fecha de lanzamiento de un modelo en al menos una región en todo el mundo
  2. En el caso de las implementaciones globales, todas las versiones futuras del modelo a partir de la gpt-4o y gpt-4 0409 estarán disponibles con su modelo siguiente correcto (NN+1) para la comparación conjunta.
  3. Los clientes disponen de 60 días para probar un nuevo modelo de disponibilidad general en al menos una región global, o estándar, antes de que se produzca cualquier actualización a un modelo de disponibilidad general más reciente.

Consideraciones para la nube pública de Azure

Tenga en cuenta lo siguiente:

  1. Todas las combinaciones de versiones de modelos no estarán disponibles en todas las regiones.
  2. Es posible que las versiones del modelo N y N+1 no estén siempre disponibles en la misma región.
  3. La versión del modelo de disponibilidad general N podría actualizarse a una versión futura del modelo N+X en algunas regiones en función de las limitaciones de capacidad, y sin que la nueva versión del modelo N+X esté disponible por separado para realizar pruebas en la misma región. La nueva versión del modelo estará disponible para probar en otras regiones antes de que se programe cualquier actualización.
  4. Las versiones preliminares del modelo y las versiones de disponibilidad general del mismo modelo no siempre estarán disponibles para probarse juntas en la misma región. Habrá versiones preliminares y de disponibilidad general disponibles para probarlas en diferentes regiones.
  5. Nos reservamos el derecho a limitar el uso de una región determinada por parte de futuros clientes para equilibrar la calidad del servicio para los clientes existentes.
  6. Como siempre en Microsoft, la seguridad es lo más importante. Si se descubre que un modelo o una versión del modelo presenta problemas de cumplimiento o seguridad, nos reservamos el derecho a invocar la necesidad de realizar retiradas de emergencia. Consulte los términos del servicio para obtener más información.

Consideraciones especiales para las nubes de Azure Government

  1. Las implementaciones estándar globales no estarán disponibles en las nubes gubernamentales.
  2. No todos los modelos ni las versiones del modelo disponibles en la nube comercial o pública estarán disponibles en nubes gubernamentales.
  3. En las nubes de Azure Government, tenemos la intención de admitir solo una versión de un modelo determinado a la vez.
    1. Por ejemplo, solo una versión de gpt-35-turbo 0125 y gpt-4o (2024-05-13).
  4. Sin embargo, habrá una superposición de 30 días entre las nuevas versiones del modelo, donde habrá más de dos disponibles.
    1. Por ejemplo, si gpt-35-turbo 0125 o gpt-4o (2024-05-13) se actualiza a una versión futura, o
    2. para los cambios de familia de modelos más allá de las actualizaciones de la versión, como al pasar de gpt-4 1106-preview a gpt-4o (2024-05-13).

Quién recibe una notificación de las próximas retiradas

Azure OpenAI notifica a los miembros de los roles siguientes para cada suscripción con una implementación de un modelo con una próxima retirada.

  • Propietario
  • Colaborador
  • Lector
  • Colaborador de supervisión
  • Lector de supervisión

Cómo prepararse para las retiradas de modelos y las actualizaciones de versiones

Para prepararse para las retiradas de modelos y las actualizaciones de versiones, se recomienda que los clientes prueben sus aplicaciones con los nuevos modelos y versiones y evalúen su comportamiento. También se recomienda que los clientes actualicen sus aplicaciones para que usen los nuevos modelos y versiones antes de la fecha de retirada.

Para obtener más información sobre el proceso de evaluación del modelo, vea la guía introducción a la evaluación de modelos.

Para obtener información sobre el proceso de actualización del modelo, vea Actualización a un nuevo modelo o versión.

Modelos actuales

Nota:

No todos los modelos pasan por un período de desuso antes de la retirada. Algunos modelos o versiones solo tienen una fecha de retirada.

Los modelos personalizados están sujetos a la misma programación de desuso y retirada que su modelo base equivalente.

Estos modelos están disponibles actualmente para su uso en Azure OpenAI Service.

Modelo Versión Fecha de retirada Reemplazos sugeridos
babbage-002 1 Fecha de desuso: 15 de noviembre de 2024
Fecha de retirada: 27 de enero de 2025
davinci-002 1 Fecha de desuso: 15 de noviembre de 2024
Fecha de retirada: 27 de enero de 2025
dall-e-2 2 27 de enero de 2025 dalle-3
dall-e-3 3 No antes del 30 de abril de 2025
gpt-35-turbo 0301 27 de enero de 2025

Las implementaciones establecidas en actualización automática en el predeterminado se actualizarán automáticamente a la versión: 0125, a partir del 13 de noviembre de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo
gpt-35-turbo-16k
0613 27 de enero de 2025

Las implementaciones establecidas en actualización automática en el predeterminado se actualizarán automáticamente a la versión: 0125, a partir del 13 de noviembre de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo 1106 No antes del 27 de enero de 2025

Las implementaciones establecidas en actualización automática en el predeterminado se actualizarán automáticamente a la versión: 0125, a partir del 13 de noviembre de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo 0125 No antes del 22 de febrero de 2025 gpt-4o-mini
gpt-4
gpt-4-32k
0314 6 de junio de 2025 gpt-4o
gpt-4
gpt-4-32k
0613 6 de junio de 2025 gpt-4o
gpt-4 1106-preview Se actualizará a gpt-4 versión: turbo-2024-04-09, a partir del 27 de enero de 2025 1 gpt-4o
gpt-4 0125-preview Se actualizará a gpt-4 versión: turbo-2024-04-09, a partir del 27 de enero de 2025 1 gpt-4o
gpt-4 vision-preview Se actualizará a gpt-4 versión: turbo-2024-04-09, a partir del 27 de enero de 2025 1 gpt-4o
gpt-4o 2024-05-13 No antes del 20 de mayo de 2025

Las implementaciones establecidas en actualización automática en el predeterminado se actualizarán automáticamente a la versión: 2024-08-06, a partir del 5 de diciembre de 2024.
gpt-4o-mini 2024-07-18 No antes del 18 de julio de 2025
gpt-3.5-turbo-instruct 0914 No antes del 14 de septiembre de 2025
text-embedding-ada-002 2 No antes del 3 de abril de 2025 text-embedding-3-small o text-embedding-3-large
text-embedding-ada-002 1 No antes del 3 de abril de 2025 text-embedding-3-small o text-embedding-3-large
text-embedding-3-small No antes del 2 de febrero de 2025
text-embedding-3-large No antes del 2 de febrero de 2025

1 Notificaremos a todos los clientes con estas implementaciones en versión preliminar al menos 30 días antes del inicio de las actualizaciones. Publicaremos un calendario de actualizaciones en el que se detallará el orden de las regiones y las versiones de los modelos que seguiremos durante las actualizaciones, y enlazaremos a ese calendario desde aquí.

Importante

Las funciones de vista previa de las mejoras de visión, como el reconocimiento óptico de caracteres (OCR), la conexión a tierra de objetos y las indicaciones de vídeo, se retirarán y dejarán de estar disponibles una vez gpt-4 versión: vision-preview se actualice a turbo-2024-04-09. Si actualmente confía en alguna de estas características en versión preliminar, esta actualización automática del modelo será un cambio importante.

Versiones predeterminadas del modelo

Modelo Versión predeterminada actual Nueva versión predeterminada Fecha de actualización predeterminada
gpt-35-turbo 0301 0125 Las implementaciones de versiones 0301, 0613y 1106 establecidas en actualización automática en predeterminada se actualizarán automáticamente a la versión: 0125, a partir del 13 de noviembre de 2024.
gpt-4o 2024-05-13 2024-08-06 Las implementaciones establecidas en actualización automática en el predeterminado se actualizarán automáticamente a la versión: 2024-08-06, a partir del 5 de diciembre de 2024.

Modelos en desuso

Estos modelos quedaron en desuso el 6 de julio de 2023 y se retiraron el 14 de junio de 2024. Estos modelos ya no están disponibles para las nuevas implementaciones. Las implementaciones creadas antes del 6 de julio de 2023 siguen estando disponibles para los clientes hasta el 14 de junio de 2024. Se recomienda a los clientes que migren sus aplicaciones a implementaciones de modelos de reemplazo antes del 14 de junio de 2024.

Si es un cliente existente que busca información sobre estos modelos, consulte Modelos heredados.

Modelo Fecha de desuso Fecha de retirada Reemplazo sugerido
ada 6 de julio de 2023 14 de junio de 2024 babbage-002
babbage 6 de julio de 2023 14 de junio de 2024 babbage-002
curie 6 de julio de 2023 14 de junio de 2024 davinci-002
davinci 6 de julio de 2023 14 de junio de 2024 davinci-002
text-ada-001 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
text-babbage-001 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
text-curie-001 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
text-davinci-002 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
text-davinci-003 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
code-cushman-001 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
code-davinci-002 6 de julio de 2023 14 de junio de 2024 GPT-35 Turbo Instruct
text-similarity-ada-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-similarity-babbage-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-similarity-curie-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-similarity-davinci-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-ada-doc-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-ada-query-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-babbage-doc-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-babbage-query-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-curie-doc-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-curie-query-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-davinci-doc-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
text-search-davinci-query-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
code-search-ada-code-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
code-search-ada-text-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
code-search-babbage-code-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small
code-search-babbage-text-001 6 de julio de 2023 14 de junio de 2024 text-embedding-3-small

Historial de retirada y desuso

25 de octubre de 2024

  • Fecha de desuso babbage-002 y davinci-002: 15 de noviembre de 2024 y fecha de retirada: 27 de enero de 2025.

12 de septiembre de 2024

  • gpt-35-turbo (0301), (0613), (1106) y gpt-35-turbo-16k (0613) actualización automática a la fecha de actualización predeterminada actualizada al 13 de noviembre de 2024.

9 de septiembre de 2024

  • Las retiradas de gpt-35-turbo (0301) y (0613) cambian al 27 de enero de 2025.
  • Se ha cambiado la fecha de actualización del modelo de versión preliminar gpt-4 para que no empiece antes del 27 de enero de 2025.

3 de septiembre de 2024

  • Tablas actualizadas para incluir información sobre las actualizaciones de la versión gpt-35-turbo predeterminada. Las implementaciones de las versiones 0301, 0613 y 1106 establecidas en Actualización automática predeterminada se actualizarán automáticamente a la versión: 0125, a partir del 15 de noviembre de 2024.|

22 de agosto de 2024

  • Se actualizó gpt-35-turbo (0301) fecha de retirada no anterior al 1 de noviembre de 2024.
  • Actualizada la fecha de caducidad de gpt4 y gpt-4-32k (0314 y 0613) al 1 de noviembre de 2024.

8 de agosto de 2024

  • Actualización de la fecha de retirada de los modelos gpt-35-turbo y gpt-35-turbo-16k (0613) al 1 de noviembre de 2024.

30 de julio de 2024

  • Se ha actualizado gpt-4 fecha de actualización del modelo de versión preliminar al 15 de noviembre de 2024 o posterior para las siguientes versiones:
    • 1106-preview
    • 0125-preview
    • Versión preliminar de visión (la característica de mejora de visión ya no se admitirá una vez que este modelo se retire o actualice).

18 de julio de 2024

  • Se ha actualizado la fecha de desuso de gpt-4 0613 al 1 de octubre de 2024 y la fecha de retirada al 6 de junio de 2025.

19 de junio de 2024

  • Fecha de retirada actualizada de gpt-35-turbo 0301 a no antes del 1 de octubre de 2024.
  • Fecha de retirada actualizada de gpt-35-turbo y gpt-35-turbo-16k 0613 al 1 de octubre de 2024.
  • Fecha de desuso actualizada de gpt-4 y gpt-4-32k 0314 al 1 de octubre de 2024 y la fecha de retirada al 6 de junio de 2025.

4 de junio de 2024

Fecha de retirada de los modelos heredados actualizada en un mes más.

24 de abril de 2024

La fecha de retirada más temprana para gpt-35-turbo 0301 y 0613 se ha actualizado al 1 de agosto de 2024.

13 de marzo de 2024

Hemos publicado este documento para proporcionar información sobre los modelos actuales, los modelos en desuso y las próximas retiradas.

23 de febrero de 2024

Anunciamos la próxima actualización local de gpt-4 versión 1106-preview para 0125-preview que se iniciará no antes del 8 de marzo de 2024.

30 de noviembre de 2023

La versión predeterminada de gpt-4 y gpt-3-32k se actualizó de 0314 a 0613 partir del 30 de noviembre de 2023. La actualización de las implementaciones 0314 establecidas para la actualización automática a 0613 se completó el 3 de diciembre de 2023.

6 de julio de 2023

Anunciamos el desuso de los modelos con la próxima retirada el 5 de julio de 2024.