Поделиться через


Azure OpenAI в моделях Azure AI Foundry

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака. Сведения о доступности модели для Azure для государственных организаций см. в службе OpenAI для Azure для государственных организаций.

Модели Описание
codex-mini Точно настроенная версия o4-mini.
Серия GPT-4.1 Последняя версия модели из Azure OpenAI
модель маршрутизатора Модель, которая интеллектуально выбирает из набора базовых моделей чата, чтобы ответить на заданный запрос.
предварительный просмотр использования компьютера Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером.
Предварительная версия GPT-4.5 Последняя модель GPT, которая превосходно справляется с разнообразными задачами по работе с текстом и изображениями.
модели o-серии Модели рассуждения с расширенной способностью решать задачи и повышенным вниманием и способностями.
GPT-4o и GPT-4o mini и GPT-4 Turbo Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
генерация изображений Серия моделей, которые могут создавать исходные изображения на естественном языке.
Аудио Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают либо с низкой задержкой, "ввод речи, вывод речи" разговорные взаимодействия, либо генерацию аудио.

Серия GPT 4.1

Доступность по регионам

Модель Регион
gpt-4.1 (2025-04-14) См. таблицу моделей.
gpt-4.1-nano (2025-04-14) См. таблицу моделей.
gpt-4.1-mini (2025-04-14) См. таблицу моделей.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-nano (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.

модельный маршрутизатор

Модель, которая интеллектуально выбирает из набора базовых моделей чата, чтобы ответить на заданный запрос.

Доступность по регионам

Модель Регион
model-router (2025-05-19) Восточная часть США 2 (глобальный стандарт), Центральная Швеция (глобальный стандарт)

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
model-router (2025-05-19) Модель, которая интеллектуально выбирает из набора базовых моделей чата, чтобы ответить на заданный запрос. 200,000* 32768 (серия GPT 4.1)
100 K (o4-mini)
31 мая 2024 г.

*Большие контекстные окна совместимы с некоторыми базовыми моделями, что означает, что вызов API с большим контекстом будет успешным только в том случае, если запрос будет перенаправлен в правильную модель, в противном случае вызов завершится ошибкой.

предварительный просмотр использования компьютера

Экспериментальная модель, обученная для использования с инструментом API ответов. Его можно использовать в сочетании с 3-сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры при получении контекста из снимков экрана текущей среды.

Осторожность

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Доступность

Для доступа к computer-use-preview требуется регистрация, и доступ будет предоставлен на основе критериев приемлемости корпорации Майкрософт. Клиентам, имеющим доступ к другим моделям ограниченного доступа, по-прежнему потребуется запросить доступ к этой модели.

Запрос доступа: computer-use-preview приложение модели ограниченного доступа

После предоставления доступа необходимо создать деплоймент для модели.

Доступность по регионам

Модель Регион
computer-use-preview См. таблицу моделей.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
computer-use-preview (2025-03-11) Специализированная модель для использования с инструментом API ответов

-Инструменты
-Стриминг
-Текст(ввод/вывод)
— Изображение(ввод)
8,192 1,024 Октябрь 2023 г.

Предварительная версия GPT-4.5

Доступность по регионам

Модель Регион
gpt-4.5-preview См. таблицу моделей.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-4.5-preview (2025-02-27)
Предварительная версия GPT-4.5
GPT 4.1 является рекомендуемой заменой для этой модели. Отличается высокой эффективностью в работе с различными текстовыми и графическими задачами.
— структурированные выходные данные
— кэширование подсказок
-Инструменты
- Стриминг
— Text(input/output)
— Изображение(ввод)
128 000 16,384 Октябрь 2023 г.

Замечание

Ожидается, что модель не может ответить на вопросы о себе. Если вы хотите узнать, когда были установлены ограничения на данные обучения модели, или получить другие сведения о модели, обратитесь к документации модели выше.

модели o-серии

Модели серии Azure OpenAI* специально разработаны для решения задач логического мышления и поиска решений с улучшенными возможностями и повышенной сосредоточенностью. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
codex-mini (2025-05-16) Точно настроенная версия o4-mini.
- API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции и инструменты
Полная сводка возможностей
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3-pro (2025-06-10) - API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции и инструменты
Полная сводка возможностей
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o4-mini (2025-04-16) - НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования.

— API завершения чата
- API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции и инструменты
Полная сводка возможностей
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3 (2025-04-16) - НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования.

— API завершения чата
- API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции/инструменты и вызов параллельных инструментов
Полная сводка возможностей
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные
обработка только текста
— Функции и инструменты
Входные данные: 200 000
Результат: 100 000
Октябрь 2023 г.
o1 (2024-12-17) - Расширенные способности рассудка.
— структурированные выходные данные
— Текст, обработка изображений
— Функции и инструменты
Входные данные: 200 000
Результат: 100 000
Октябрь 2023 г.
o1-preview (2024-09-12) Более ранняя предварительная версия Вход: 128 000
Выход: 32 768
Октябрь 2023 г.
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов.

Глобальное стандартное развертывание, доступное по умолчанию.

Стандартные (региональные) развертывания в настоящее время доступны только для избранных клиентов, которые получили доступ в рамках ограниченного выпуска доступа o1-preview.
Вход: 128 000
Результат: 65 536
Октябрь 2023 г.

Доступность

Чтобы узнать больше о расширенных o-series моделях, см. статью Начало работы с моделями рассуждения.

Доступность по регионам

Модель Регион
codex-mini Восточная часть США2 и Центральная Швеция (глобальный стандарт)
o3-pro Восточная часть США2 и Центральная Швеция (глобальный стандарт)
o4-mini См. таблицу моделей.
o3 См. таблицу моделей.
o3-mini См. таблицу моделей.
o1 См. таблицу моделей.
o1-preview См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.
o1-mini См. таблицу моделей.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Как я могу получить доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного развертывания модели и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

Когда ваш ресурс создан, вы можете развернуть модели GPT-4o. Если вы выполняете автоматическое программное развертывание, то имена моделей следующие:

  • gpt-4o Версия2024-11-20
  • gpt-4o Версия2024-08-06
  • gpt-4o Версия2024-05-13
  • gpt-4o-mini Версия2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

  • gpt-4 Версия0314
  • gpt-4 Версия0613
  • gpt-4-32k Версия0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью, в сводной таблице моделей.

Модели GPT-4 и GPT-4 Turbo

  • Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей , чтобы узнать, как Azure OpenAI обрабатывает обновления версий модели и работать с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Последняя большая модель GA
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенная возможность творческого письма
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-08-06)
GPT-4o (Omni)
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
Последняя модель небольшой версии общего доступа
— Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo.
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с видением
Новая модель общего доступа
— Замена всех предыдущих моделей GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Вход: 128 000
Выходные данные: 4 096
Декабрь 2023 г.
gpt-4-32k (0613) Более старая модель GA
— Базовый вызов функций с инструментами
32,768 Сентябрь 2021 г.
gpt-4 (0613) Более старая модель GA
— Базовый вызов функций с инструментами
8,192 Сентябрь 2021 г.
gpt-4-32k(0314) Более старая модель GA
- Сведения о прекращении поддержки
32,768 Сентябрь 2021 г.
gpt-4 (0314) Более старая модель GA
- Сведения о прекращении поддержки
8,192 Сентябрь 2021 г.

Осторожность

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее производительной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо справляется с традиционными задачами по завершению. GPT-3.5 Turbo доступен для использования с API завершения чата. GPT-3.5 Turbo Instruct имеет аналогичные возможности, как и text-davinci-003, но с использованием API завершений вместо API завершений чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-35-turbo (0125) NEW Последняя модель GA
— режим JSON
— параллельные вызовы функций
— воспроизводимый вывод (предпросмотр)
— более высокая точность при реагировании в запрошенных форматах.
— Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo (1106) Старая GA модель
— режим JSON
— параллельные вызовы функций
— воспроизводимый результат (предпросмотр)
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения
— замена устаревших моделей завершения
4,097 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата вы можете узнать в нашем подробном руководстве.

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Встраивания

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями встраивания невозможно. Для перехода от использования text-embedding-ada-002 к text-embedding-3-large, вам потребуется создать новые объекты векторизации.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает, что как большие, так и небольшие модели внедрения третьего поколения обеспечивают более высокую среднюю производительность при многоязычном извлечении согласно тесту MIRACL, при этом сохраняя уровень производительности для английских задач согласно тесту MTEB.

Эталон оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование по бенчмарку MTEB в OpenAI показало, что даже если размеры модели третьего поколения сокращаются до менее text-embeddings-ada-002 1536, производительность остается немного лучше.

Модели создания изображений

Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. GPT-image-1 находится в общедоступной предварительной версии ограниченного доступа. DALL-E 3 обычно доступен для использования с интерфейсами REST API. DALL-E 2 и DALL-E 3 с клиентскими SDK доступны в предварительном просмотре.

Доступность

Для доступа к gpt-image-1 требуется регистрация, и доступ будет предоставлен на основе критериев приемлемости корпорации Майкрософт. Клиентам, имеющим доступ к другим моделям ограниченного доступа, по-прежнему потребуется запросить доступ к этой модели.

Запрос доступа: gpt-image-1 приложение модели ограниченного доступа

После предоставления доступа необходимо создать деплоймент для модели.

Доступность по регионам

Модель Регион
dall-e-3 Восток США
Восточная Австралия
Центральная Швеция
gpt-image-1 Западная часть США 3 (глобальный стандарт)
Север ОАЭ (глобальный стандарт)
Центральная Польша (глобальный стандарт)

Модели создания видео

Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в общедоступной предварительной версии.

Доступность по регионам

Модель Регион
sora Восток США 2

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и интерфейсы audio API.

Aудиомодели GPT-4o

Звуковые модели GPT 4o являются частью семейства моделей GPT-4o и поддерживают либо низкую задержку в диалоговых взаимодействиях "речь на вход, речь на выход", либо генерацию звука.

Осторожность

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Сведения о максимальных токенах запроса и обучающих данных доступны в следующей таблице.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для создания звука и текста. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-audio-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для создания звука и текста. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-realtime-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023 г.

Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.

API для работы с аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб
gpt-4o-transcribe Преобразование речи в текст с поддержкой GPT-4o. 25 Мб
gpt-4o-mini-transcribe Преобразование речи в текст, работает на основе GPT-4o mini. 25 Мб

Модели перевода речи

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели Описание
tts Синтез речи, оптимизированный для скорости.
tts-hd Синтез речи, оптимизированный для высокого качества.
gpt-4o-mini-tts Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в стиле или тоне.

Для получения дополнительной информации см. раздел Доступность аудиомоделей по регионам в этой статье.

Сводка модели и доступность в регионе

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт предлагается с глобальным вариантом развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Provisioned также предлагается с возможностью глобального развертывания, что позволяет клиентам приобретать и развертывать единицы выделенной пропускной способности в глобальной инфраструктуре Azure.

Все развертывания могут выполнять одинаковые операции вывода данных, однако существенно различаются стоимость, масштабирование и производительность. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.

Доступность глобальной стандартной модели

Регион o3-pro, 2025-06-10 codex-mini, 2025-05-16 модель-маршрутизатор, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 предварительный просмотр использования компьютера, 11.03.2025 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20
австралиявосток - - - - - - - - - - - - - - - - - -
Бразильский Юг - - - - - - - - - - - - - - - - -
Канада Восток - - - - - - - - - - - - - - - - -
Истус - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
Германия-запад-центр - - - - - - - - - - - - - - - - -
северная италия - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - -
Норвегия Восток - - - - - - - - - - - - - - - - - -
Польша Центральная - - - - - - - - - - - - - - - - -
Южная Африка-север - - - - - - - - - - - - - - - - - -
СаутЦентралус - - - - - - - - - - - - - - - -
Южная Индия - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - -
SwedenCentral - - -
Швейцария север - - - - - - - - - - - - - - - - -
уаенорт - - - - - - - - - - - - - - - -
UKSOUTH - - - - - - - - - - - - - - - - -
Западная Европа - - - - - - - - - - - - - - - - -
Вестус - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Замечание

o1-mini в настоящее время доступен всем клиентам для глобального стандартного развертывания.

Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.

Стандартные модели развертывания (региональные) по конечной точке

Завершение чата

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
австралиявосток - - - - - -
Канада Восток - - - - - -
Истус -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
northcentralus -
Норвегия Восток - - - - - - - -
СаутЦентралус -
Южная Индия - - - - - -
SwedenCentral
Швейцария север - - - - - - -
UKSOUTH - - - - - -
Западная Европа - - - - - - - -
Вестус
westus3 -

Замечание

o1-mini в настоящее время доступен всем клиентам для глобального стандартного развертывания.

Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Доступность модели GPT-4 и GPT-4 Turbo

Выбор уровня доступа для клиента

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Регион
gpt-4 (0314)
gpt-4-32k (0314)
Восточная часть США
Центральная Франция
Южная часть США
Юг Соединённого Королевства
gpt-4 (0613)
gpt-4-32k (0613)
Восточная часть США
Восточная часть США 2
Восточная Япония
Юг Соединённого Королевства

Модели GPT-3.5

Ознакомьтесь с версиями моделей , чтобы узнать, как Azure OpenAI обрабатывает обновления версий модели и работать с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Тонкая настройка моделей

Замечание

gpt-35-turbo — Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Azure AI Foundry и вне проекта.

Идентификатор модели Стандартные регионы обучения Глобальный учебный курс (предварительная версия) Максимальный запрос (токены) Учебные данные (вплоть до) Модальность
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
- Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г. Текст в текстовом формате
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
- 16,385 Сентябрь 2021 г. Текст в текстовом формате
gpt-4o-mini (2024-07-18) Северная часть США
Центральная Швеция
- Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
Октябрь 2023 г. Текст в текстовом формате
gpt-4o (2024-08-06) Восточная часть США2
Северная часть США
Центральная Швеция
- Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
Октябрь 2023 г. Текст и визуальное распознавание текста
gpt-4.1 (2025-04-14) Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст и визуальное распознавание текста
gpt-4.1-mini (2025-04-14) Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст в текстовом формате
gpt-4.1-nano (2025-04-14) Северная часть США
Центральная Швеция
- Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 32 768
май 2024 Текст в текстовом формате
o4-mini (2025-04-16) Восточная часть США2
Центральная Швеция
- Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст в текстовом формате

Замечание

Глобальное обучение (в общедоступной предварительной версии) обеспечивает более доступное обучение для каждого токена, но не предлагает размещение данных. В настоящее время он доступен для ресурсов Azure OpenAI в следующих регионах, а также скоро будет доступен в большем числе регионов.

  • Восточная Австралия
  • Бразилия (Юг)
  • Восток США
  • Восток США2
  • Центральная Франция
  • Западно-Центральная Германия
  • Италия Север
  • Восточная Япония (нет поддержки зрения)
  • Центральная Корея
  • северо-центральная часть США
  • Восточная Норвегия
  • Центральная Польша
  • Юго-Восточная Азия
  • Север Южной Африки
  • Южно-Центральная часть США
  • Центральная Испания
  • Центральная Швеция
  • Западная Швейцария
  • Северная Швейцария
  • Юг Соединённого Королевства
  • Западная Европа
  • Западная часть США
  • Западная часть США3

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Azure AI Foundry. Следующая таблица предназначена для стандартного развертывания. Сведения о доступности единицы выделенной пропускной способности (PTU) см. в статье о выделенной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Регион gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
австралиявосток - - - - -
Истус - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Норвегия Восток - - - - - - - - - - -
Южная Индия - - - - - - - - -
SwedenCentral - -
UKSOUTH - - - - - -
Вестус - - - - -
westus3 - - - - - -

Вывод модели из эксплуатации

Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.

Дальнейшие шаги