Поделиться через


Azure OpenAI и Azure AI Foundry Models: устаревание и вывод из эксплуатации моделей

Обзор

Модели Azure OpenAI постоянно обновляются с помощью новых и более способных моделей. В рамках этого процесса поддержка старых моделей прекращается, и они более не используются. В этом документе содержатся сведения о моделях, доступных в настоящее время, нерекомендуемых и устаревших.

Терминология

  • Исключения
    • Если модель устарела, она больше не доступна для новых клиентов. Она остается в распоряжении клиентов с существующими развертываниями до тех пор, пока модель не будет выведена из эксплуатации.
  • Отставка
    • Когда модель прекращает использование, она больше недоступна для использования. Развертывания Azure OpenAI для устаревшей модели всегда возвращают ответы об ошибках.

Уведомления

Azure OpenAI уведомляет клиентов о активных развертываниях Azure OpenAI для моделей с предстоящими выходами на пенсию. Мы уведомляем клиентов о предстоящих выходах на пенсию следующим образом для каждого развертывания:

  1. При запуске модели мы программно назначаем дату выхода на пенсию "не раньше" (для предварительных версий моделей это от 90 до 120 дней после запуска, для общедоступных моделей это 365 дней после запуска).
  2. Уведомление как минимум за 60 дней до прекращения поддержки моделей в общедоступной версии.
  3. Уведомление за 30 дней до обновления версии предварительной модели.

Выход на пенсию выполняется на последовательной основе по регионам. В отношении обновления конкретного региона или номера SKU расписание отсутствует.

Кто уведомляется о предстоящих выходах на пенсию

Azure OpenAI уведомляет клиентов двумя способами:

  • Работоспособность ресурсов Azure - Любой пользователь с правами доступа читателя или выше может просматривать оповещения о состоянии Azure, а также настраивать персонализированные оповещения по электронной почте, SMS и т. д. См. Создание оповещений о работоспособности службы
  • Электронная почта — уведомления по электронной почте автоматически отправляются владельцам подписок. Любой пользователь с разрешениями читателя может настроить собственные оповещения, следуя приведенным выше рекомендациям.

Конфигурация фильтра состояния служб Azure

Услуги = azure OpenAI service (Регистр соответствует текущему пользовательскому интерфейсу).

Типы - Health advisories = Upgrade, Deprecation, & Retirement Notifications - Service issue = Outages событий (Рекомендуется только в том случае, если вы хотите получать уведомления о сбоях)

Если вы хотите получать текстовые оповещения на основе SMS, а не только сообщения электронной почты, вам потребуется выбрать команду "Создать группу действий " и в разделе "Тип уведомления", выбрать сообщение электронной почты/SMS/Push/Voice , а затем настроить номер телефона.

Доступность модели

  1. По крайней мере один год доступности модели для моделей общедоступной версии после даты выпуска модели по крайней мере в одном регионе по всему миру
  2. Для глобальных развертываний все будущие версии модели, начиная с gpt-4o и gpt-4 0409, будут доступны вместе с их (N) следующей последующей моделью (N+1) для сравнения.
  3. У клиентов есть 60 дней, чтобы опробовать новую модель общедоступной версии по крайней мере в одном глобальном или стандартном регионе, прежде чем произойдут какие-либо обновления до более новой модели общедоступной версии.

Рекомендации по общедоступному облаку Azure

Имейте в виду следующее:

  1. Все комбинации версий модели будут недоступны во всех регионах.
  2. Версии N и N+1 могут быть не всегда доступны в одном и том же регионе.
  3. Версия модели GA N может обновиться до будущей версии модели N+X в некоторых регионах из-за ограничений пропускной способности, при этом новая версия модели N+X не доступна для тестирования в том же регионе. Новая версия модели будет доступна для тестирования в других регионах перед планированием обновлений.
  4. Предварительные версии моделей и общедоступные версии той же модели не всегда будут доступны для тестирования вместе в одном и том же регионе. Для тестирования в разных регионах будут доступны предварительные версии и версии общедоступной версии.
  5. Мы зарезервируем право ограничить будущих клиентов, использующих определенный регион, чтобы сбалансировать качество обслуживания для существующих клиентов.
  6. Как и всегда в Корпорации Майкрософт, безопасность имеет крайне важное значение. Если у модели или версии модели возникают проблемы с соответствием или безопасностью, мы оставляем за собой право на экстренный вывод из эксплуатации. Дополнительные сведения см. в условиях обслуживания.

Особые соображения по облакам Azure для государственного сектора

  1. Глобальные стандарты развертывания не будут доступны в государственных облаках.
  2. Не все модели или версии модели, доступные в коммерческом или общедоступном облаке, будут доступны в облаках государственных организаций.
  3. В облаках Azure для государственных организаций мы намерены поддерживать только одну версию данной модели одновременно.
    1. Например, существует только одна версия gpt-35-turbo 0125 и gpt-4o (2024-05-13).
  4. Однако в течение 30 дней, когда новые версии модели будут пересекаться, будет доступно более двух версий.
    1. Например, если gpt-35-turbo 0125 или gpt-4o (2024-05-13) обновляется до новой версии, или
    2. для изменений семейства моделей за пределами обновлений версий, таких как при переходе с gpt-4 1106-preview на gpt-4o (2024-05-13).

Подготовка к выводу моделей из эксплуатации и обновлению версий

Чтобы подготовиться к снятию моделей с эксплуатации и обновлению версий, мы рекомендуем клиентам протестировать свои приложения на новых моделях и версиях и оценить их поведение. Мы также рекомендуем клиентам обновлять свои приложения для использования новых моделей и версий до даты выхода на пенсию.

Дополнительные сведения о процессе оценки модели см. в руководстве по началу работы с моделью.

Сведения о процессе обновления модели см. в разделе "Как обновиться до новой модели или версии".

Дополнительные сведения об управлении обновлениями моделей и миграцией для подготовленных развертываний см. в разделе "Управление моделями для подготовленных типов развертывания"

Текущие модели

Замечание

Не все модели проходят через период устаревания до вывода из использования. Некоторые модели и версии имеют только дату выхода на пенсию.

Точно настроенные модели подвергаются иному расписанию депрекации и вывода из эксплуатации по сравнению с эквивалентной базовой моделью.

Сейчас эти модели доступны для использования в Azure OpenAI.

Создание текста

Модель Версия Дата выхода на пенсию Модель замены
gpt-4.5-preview 2025-02-27 Автоматическое обновление не выполняется
14 июля 2025 г.
gpt-4.1 Версия: 2025-04-14
gpt-3.5-turbo-instruct 0914 Не более 16 июля 2025 г.
o1-preview 2024-09-12 28 июля 2025 г. o1
computer-use-preview 11-03-2025 Не более 1 сентября 2025 г.
gpt-35-turbo 1106 Не более 1 сентября 2025 г. gpt-4.1-mini Версия: 2025-04-14
gpt-35-turbo 0125 Не более 1 сентября 2025 г. gpt-4.1-mini Версия: 2025-04-14
gpt-4 turbo-2024-04-09 Не более 1 сентября 2025 г. gpt-4o Версия: 2024-11-20
model router 19.05.2025 Не более 1 сентября 2025 г.
gpt-4o 13.05.2024 Не более 15 сентября 2025 г. gpt-4.1 Версия: 2025-04-14
gpt-4o-mini 18.07.2024 Не более 15 сентября 2025 г. gpt-4.1-mini Версия: 2025-04-14
o1-mini 2024-09-12 Не более 26 сентября 2025 г.
gpt-4o 2024-08-06 Не более 15 октября 2025 г. gpt-4.1 Версия: 2025-04-14
o1 17.12.2024 Не более 17 декабря 2025 г.
o3-mini 31.01.2025 Не более 1 февраля 2026 г.
gpt-4o 20.11.2024 Не более 1 марта 2026 г. gpt-4.1 Версия: 2025-04-14
gpt-4.1 2025-04-14 Не более 11 апреля 2026 г.
gpt-4.1-mini 2025-04-14 Не более 11 апреля 2026 г.
gpt-4.1-nano 2025-04-14 Не более 11 апреля 2026 г.
o4-mini 2025-04-16 Не более 11 апреля 2026 г.
o3 2025-04-16 Не более 11 апреля 2026 г.

Мы уведомляем всех клиентов об этих предварительных развертываниях по крайней мере 30 дней до начала обновления. Мы публикуем график обновлений, в котором подробно указана последовательность регионов и версий моделей, которых мы следуем во время обновлений, и ссылаемся на этот график отсюда.

Подсказка

Произойдет ли обновление модели, если новая версия модели еще не доступна в этом регионе?

Да, даже в тех случаях, когда последняя версия модели еще не доступна в регионе, мы автоматически обновляем развертывания во время запланированного периода обновления. Дополнительные сведения см. в версиях модели Azure OpenAI.

Точно настроенные модели

Точно настроенные модели выходят из эксплуатации на двух этапах: подготовка и развертывание.

Все точно настроенные модели следуют своей эквивалентной базовой модели для вывода из эксплуатации. После выхода на пенсию данная модель больше не доступна для точной настройки.

Для точно настроенных моделей, обычно доступных с момента gpt-4o-2024-08-06, упразднение развертывания происходит через 1 год после упразднения обучения. При завершении развертывания вывод и развертывание возвращают ответы на ошибки.

Модель Версия Дата завершения обучения Дата завершения эксплуатации развертывания
gpt-35-turbo 1106 При выводе из эксплуатации базовой модели На тренинге по выходу на пенсию
gpt-35-turbo 0125 При выводе из эксплуатации базовой модели На тренинге по выходу на пенсию
gpt-4o 2024-08-06 При выводе из эксплуатации базовой модели Через год после выхода на пенсию
gpt-4o-mini 18.07.2024 При выводе из эксплуатации базовой модели Через год после выхода на пенсию
gpt-4.1 2025-04-14 При выводе из эксплуатации базовой модели Через год после выхода на пенсию
gpt-4.1-mini 2025-04-14 При выводе из эксплуатации базовой модели Через год после выхода на пенсию
gpt-4.1-nano 2025-04-14 При выводе из эксплуатации базовой модели Через год после выхода на пенсию
o4-mini 2025-04-16 При выводе из эксплуатации базовой модели Через год после выхода на пенсию

Версии модели по умолчанию

Модель Текущая версия по умолчанию Новая версия по умолчанию Дата обновления по умолчанию
gpt-35-turbo 0301 0125 Развертывания версий 0301, 0613 и 1106, установленные на Автообновление по умолчанию, будут автоматически обновлены до версии: 0125, начиная с 21 января 2025 г.
gpt-4o 2024-08-06 - -

История вывода из эксплуатации и устаревания

Чтобы отслеживать отдельные обновления этой статьи, обратитесь к журналу Git.