Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Модели Foundry от Майкрософт в каталоге моделей состоят из двух основных категорий, а именно Foundry Models, которые продает непосредственно Azure и Foundry Models от партнеров и сообщества. В этой статье перечислены некоторые модели Foundry, проданные непосредственно через Azure, их возможности, типы развертывания и регионы доступности, за исключением устаревших и снятых с производства моделей. Модели Foundry, проданные непосредственно Azure, также называются Модели непосредственно от Azure или Azure Direct Models.
Модели, проданные непосредственно Azure включают все Azure модели OpenAI и определенные, выбранные модели из лучших поставщиков. Эти модели оплачиваются через подписку Azure, покрываются соглашениями об уровне обслуживания Azure и поддерживаются Майкрософт. Список моделей Foundry, поддерживаемых службой агентов Foundry, см. в разделе " Модели, поддерживаемые службой агента", а также список моделей Foundry от партнеров, см. в разделе "Модели Foundry" от партнеров и сообщества.
Подсказка
Используйте вкладки в верхней части этой страницы, чтобы переключаться между моделями Azure OpenAI и Other model collections от поставщиков, таких как Cohere, DeepSeek, Meta, Mistral AI и xAI.
Azure OpenAI в моделях Майкрософт Foundry
Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure OpenAI в Azure для государственных организаций.
| Модели | Description |
|---|---|
| Серия GPT-5.4 |
NEWgpt-5.4-mini, , gpt-5.4-nano, gpt-5.4gpt-5.4-pro |
| Серия GPT-5.3 |
NEWgpt-5.3-chat, gpt-5.3-codex |
| Серия GPT-5.2 |
NEWgpt-5.2-codex, gpt-5.2, gpt-5.2-chatpreview |
| Серия GPT-5.1 |
NEWgpt-5.1, gpt-5.1-chatPreview, gpt-5.1-codex, gpt-5.1-codex-mini |
| Сора | НОВАЯ сора-2 |
| Серия GPT-5 |
gpt-5, , gpt-5-mini, gpt-5-nanogpt-5-chatпредварительная версия |
| gpt-oss | Модели причин открытого веса |
| codex-mini | Точно настроенная версия o4-mini. |
| Серия GPT-4.1 |
gpt-4.1, gpt-4.1-mini, gpt-4.1-nano |
| предварительный просмотр использования компьютера | Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером. |
| модели o-серии | Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей. |
| GPT-4o, GPT-4o mini и GPT-4 Turbo | Модели Azure OpenAI с поддержкой многомодальных версий, которые могут принимать на вход как текст, так и изображения. |
| Embeddings | Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов. |
| Генерирование изображений | Серия моделей, которые могут создавать исходные изображения на естественном языке. |
Video generation |
Модель, которая может создавать исходные видео-сцены из текстовых инструкций. |
| Аудио | Серия моделей для преобразования речи в текст, перевод и текст в речь. Модели аудио GPT-4o поддерживают либо разговорные взаимодействия с речевым входом и выходом с низкой задержкой, либо генерацию аудио. |
GPT-5.4
| Модель | Регион |
|---|---|
gpt-5.4 |
Смотрите таблицу моделей |
gpt-5.4-pro |
Смотрите таблицу моделей |
gpt-5.4-mini |
Глобальный стандарт: Восток США2 Центральная Швеция Южно-Центральный регион США Центральная Польша |
gpt-5.4.nano |
Глобальный стандарт: Восток США2 Центральная Швеция Южно-Центральный регион США Центральная Польша Datazone Standard: Восток США2 Южно-Центральный регион США |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.4 (2026-03-05) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей. |
1,050,000 | 128,000 | Август 2025 г. |
gpt-5.4-pro (2026-03-05) |
-
Рассуждение - API ответов. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей. |
1,050,000 | 128,000 | Август 2025 г. |
gpt-5.4-mini (2026-03-17) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
gpt-5.4-nano (2026-03-17) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
GPT-5.3
| Модель | Регион |
|---|---|
gpt-5.3-codex |
Смотрите таблицу моделей |
gpt-5.3-chat |
Восточная часть США2 и Центральная Швеция (глобальный стандарт) |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.3-codex (2026-02-24) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
gpt-5.3-chat (2026-03-03)Preview |
— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | Август 2025 г. |
GPT-5.2
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5.2 |
См. таблицу моделей. |
gpt-5.2-chat
Предварительный просмотр |
См. таблицу моделей. |
gpt-5.2-codex |
Смотрите таблицу моделей |
Доступ будет предоставлен на основе критериев соответствия Майкрософт. Клиенты, которые ранее подавали заявку и получили доступ к модели с ограниченным доступом, не нужно подавать заявку снова, так как утвержденные подписки автоматически будут предоставлены доступ при выпуске модели.
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.2-codex (2026-01-14) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | |
gpt-5.2 (2025-12-11) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
gpt-5.2-chat (2025-12-11)Preview |
— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | Август 2025 г. |
gpt-5.2-chat (2026-02-10)Preview |
— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | Август 2025 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
ГПТ-5.1
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5.1 |
См. таблицу моделей. |
gpt-5.1-chat
Предварительный просмотр |
См. таблицу моделей. |
gpt-5.1-codex |
См. таблицу моделей. |
gpt-5.1-codex-mini |
См. таблицу моделей. |
gpt-5.1-codex-max |
См. таблицу моделей. |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.1 (2025-11-13) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-chat (2025-11-13) Preview |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | 30 сентября 2024 г. |
gpt-5.1-codex (2025-11-13) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-codex-mini (2025-11-13) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-codex-max (2025-12-04) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Это важно
gpt-5.1reasoning_effortпо умолчанию равенnone. При обновлении с предыдущих моделей рассуждений доgpt-5.1, помните, что может потребоваться обновить ваш код, чтобы явно указать уровеньreasoning_effort, если вы хотите, чтобы произошло рассуждение.gpt-5.1-chatдобавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметрыtemperature. При переходе от использованияgpt-5-chat(которая не является моделью рассуждения) кgpt-5.1-chatубедитесь, что вы удаляете из кода все пользовательские параметры, такие какtemperature, которые не поддерживаются моделями рассуждения.gpt-5.1-codex-maxдобавляет поддержку установкиreasoning_effortдляxhigh. Использование рассуждательной возможностиnoneне поддерживаетсяgpt-5.1-codex-max.
GPT-5
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5 (2025-08-07) |
См. таблицу моделей. |
gpt-5-mini (2025-08-07) |
См. таблицу моделей. |
gpt-5-nano (2025-08-07) |
См. таблицу моделей. |
gpt-5-chat (2025-08-07) Предварительная версия |
См. таблицу моделей. |
gpt-5-chat (2025-10-03) Предварительная версия |
См. таблицу моделей. |
gpt-5-codex (2025-09-11) |
См. таблицу моделей. |
gpt-5-pro (2025-10-06) |
См. таблицу моделей. |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5-mini (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 31 мая 2024 г. |
gpt-5-nano (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 31 мая 2024 г. |
gpt-5-chat (2025-08-07)Preview |
— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст |
128,000 | 16,384 | 30 сентября 2024 г. |
gpt-5-chat (2025-10-03)Предварительный просмотр1 |
— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст |
128,000 | 16,384 | 30 сентября 2024 г. |
gpt-5-codex (2025-09-11) |
-
Только API ответов . - Входные данные: текст и изображение - Выходные данные: только текст — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | - |
gpt-5-pro (2025-10-06) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
Замечание
1gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:
- Узнайте и интерпретируйте эмоциональный контекст более точно, способствуя более тонким и эмпатическим взаимодействиям.
- Предоставляйте поддерживающие и ответственные ответы в разговорах, связанных с психическим здоровьем, обеспечивая деликатность и соблюдение лучших практик.
Эти улучшения стремятся сделать GPT-5-чат более учитывающим контекст, ориентированным на человека и надежным в сценариях, где важно учитывать эмоциональный тон и благополучие.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
gpt-oss
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-oss-120b |
Все Azure регионы OpenAI |
Capabilities
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-oss-120b (предварительная версия) |
— только ввод/вывод текста — API завершения чата - Потоковое воспроизведение — Вызов функции — структурированные выходные данные -Рассуждение — доступно для развертывания1 и с помощью управляемых вычислений |
131,072 | 131,072 | 31 мая 2024 г. |
gpt-oss-20b (предварительная версия) |
— только ввод/вывод текста — API завершения чата - Потоковое воспроизведение — Вызов функции — структурированные выходные данные -Рассуждение — доступно с помощью managed compute и Foundry Local |
131,072 | 131,072 | 31 мая 2024 г. |
1 В отличие от других моделей OpenAI Azure gpt-oss-120b требуется проект Foundry для развертывания модели.
Развертывание с помощью кода
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
Серия GPT-4.1
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-4.1 (2025-04-14) |
См. таблицу моделей. |
gpt-4.1-nano (2025-04-14) |
См. таблицу моделей. |
gpt-4.1-mini (2025-04-14) |
См. таблицу моделей. |
Capabilities
Это важно
Известная проблема влияет на все модели серии GPT 4.1. Крупные определения вызовов инструментов или функций, превышающие 300 000 токенов, приводят к сбоям, даже если не достигнут предел контекста модели в 1 млн токенов.
Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.
Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
Ниже приведено сообщение об ошибке ДЛЯ API ответов:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных маркеров | Обучающие данные (до определенного объема) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
gpt-4.1-nano (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
gpt-4.1-mini (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
предварительный просмотр использования компьютера
Экспериментальная модель, обученная для использования с инструментом API ответов.
Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Регистрация требуется для доступа к computer-use-preview. Доступ предоставляется на основе критериев соответствия Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.
Чтобы запросить доступ, перейдите в computer-use-preview приложение модели с ограниченным доступом. При предоставлении доступа необходимо создать развертывание для модели.
Доступность по регионам
| Модель | Регион |
|---|---|
computer-use-preview |
См. таблицу моделей. |
Capabilities
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных маркеров | Обучающие данные (до определенного объема) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
Специализированная модель для использования с инструментом API ответов -Инструменты - Стриминг — Текст (входные и выходные данные) — изображение (входные данные) |
8,192 | 1,024 | Октябрь 2023 |
модели o-серии
Модели o-серии Azure OpenAI предназначены для работы с задачами логического мышления и решения проблем с повышенным вниманием и расширенными возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
codex-mini (2025-05-16) |
Точно настроенная версия o4-mini. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3-pro (2025-06-10) |
-
API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o4-mini (2025-04-16) |
-
Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3 (2025-04-16) |
-
Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3-mini (2025-01-31) |
-
Расширенные способности рассудка. — структурированные выходные данные. — только текстовая обработка. — Функции и инструменты. |
Входные данные: 200 000 Результат: 100 000 |
Октябрь 2023 |
o1 (2024-12-17) |
-
Расширенные способности рассудка. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. |
Входные данные: 200 000 Результат: 100 000 |
Октябрь 2023 |
o1-preview (2024-09-12) |
Более ранняя предварительная версия. | Вход: 128 000 Выход: 32 768 |
Октябрь 2023 |
o1-mini (2024-09-12) |
Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. — Глобальное развертывание уровня "Стандартный", доступное по умолчанию. — Стандартные (региональные) развертывания в настоящее время доступны только для пользователей, которые получили доступ в рамках выпуска o1-preview ограниченного доступа. |
Вход: 128 000 Результат: 65 536 |
Октябрь 2023 |
Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".
Доступность по регионам
| Модель | Регион |
|---|---|
codex-mini |
East US2 и Sweden Central (глобальный стандарт). |
o3-pro |
East US2 и Sweden Central (глобальный стандарт). |
o4-mini |
См. таблицу моделей. |
o3 |
См. таблицу моделей. |
o3-mini |
См. таблицу моделей. |
o1 |
См. таблицу моделей. |
o1-preview |
См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа. |
o1-mini |
См. таблицу моделей. |
GPT-4o и GPT-4 Turbo
GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.
Модели GPT-4 и GPT-4 Turbo
Эти модели можно использовать только с API завершения чата.
См. версии модели, чтобы узнать, как Azure OpenAI обрабатывает обновления версий модели. Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. - Улучшенные творческие способности писать. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
— Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
— Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. |
Вход: 128 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo с визуальным модулем |
Новая общедоступная модель. — Замена всех предыдущих моделей GPT-4 ( vision-preview, 1106-Preview, 0125-Preview). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания. |
Вход: 128 000 Выходные данные: 4 096 |
Декабрь 2023 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Embeddings
text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно переключиться между моделями эмбеддингов. Чтобы перейти от использования text-embedding-ada-002 к text-embedding-3-large, необходимо создать новые эмбеддинги.
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
OpenAI сообщает, что тестирование показывает, что как большие, так и малые модели встраивания третьего поколения обеспечивают лучшую среднюю производительность для многоязычного извлечения с использованием бенчмарка MIRACL. Они по-прежнему сохраняют производительность при выполнении задач на английском языке по эталону MTEB.
| Эталон оценки | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| Среднее значение MIRACL | 31.4 | 44.0 | 54.9 |
| Среднее значение MTEB | 61.0 | 62.3 | 64.6 |
Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade
Тестирование тестов MTEB в OpenAI показало, что даже если размеры модели третьего text-embeddings-ada-002поколения сокращаются до меньше 1536 измерений, производительность остается немного лучше.
Модели создания изображений
Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели серии GPT-image-1 находятся в предварительной версии ограниченного доступа.
Регистрация требуется для доступа к gpt-image-1, gpt-image-1-mini или gpt-image-1.5. Доступ предоставляется на основе критериев соответствия Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.
Чтобы запросить доступ, заполните форму заявки: Подать заявку на доступ к GPT-image-1; Подать заявку на доступ к GPT-image-1.5. При предоставлении доступа необходимо создать развертывание для модели.
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-image-1 |
Смотрите таблицу моделей |
gpt-image-1-mini |
Смотрите таблицу моделей |
gpt-image-1.5 |
Смотрите таблицу моделей |
Модели создания видео
Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.
Доступность по регионам
| Модель | Регион |
|---|---|
sora |
Смотрите таблицу моделей |
sora-2 |
Смотрите таблицу моделей |
Звуковые модели
Звуковые модели в Azure OpenAI доступны через API realtime, completions и audio.
Aудиомодели GPT-4o
Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают низкую задержку, речь на входе, речь на выходе в разговорных взаимодействиях или звуковое поколение.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17)Preview |
Звуковая модель для создания звука и текста. | Вход: 128 000 Выходные данные: 16 384 |
Сентябрь 2023 г. |
gpt-4o-audio-preview (2024-12-17) |
Звуковая модель для создания звука и текста. | Вход: 128 000 Выходные данные: 16 384 |
Сентябрь 2023 г. |
gpt-4o-realtime-preview (2025-06-03) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4o-realtime-preview (2024-12-17) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 16 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4o-mini-realtime-preview (2024-12-17)Preview |
Звуковая модель для обработки звука в режиме реального времени. | Вход: 128 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-audio(28.08.2025)gpt-audio-mini(06.10.2025) |
Звуковая модель для создания звука и текста. | Входные данные: 128 00 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-realtime (2025-08-28) (GA)gpt-realtime-mini (2025-10-06)gpt-realtime-mini (2025-12-15) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32,00 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-audio-1.5 (2026-02-23) |
Звуковая модель для создания звука и текста. | Входные данные: 128 00 Выходные данные: 16 384 |
Сентябрь 2024 г. |
gpt-realtime-1.5 (2026-02-23) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32,00 Выходные данные: 4 096 |
Сентябрь 2024 г. |
Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.
API для работы с аудио
Аудио-модели через API /audio можно использовать для преобразования речи в текст, перевода речи и преобразования текста в речь.
Модели преобразования речи в текст
| Идентификатор модели | Description | Максимальный запрос (размер аудиофайла) |
|---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
gpt-4o-transcribe (2025-03-20)Preview |
Модель преобразования речи в текст на основе GPT-4o. | 25 Мб |
gpt-4o-mini-transcribe (2025-03-20)Preview |
Модель преобразования речи в текст с помощью GPT-4o mini. | 25 Мб |
gpt-4o-transcribe-diarize (2025-10-15)Preview |
Модель преобразования речи в текст с автоматическим распознаванием речи. | 25 Мб |
gpt-4o-mini-transcribe (2025-12-15)Preview |
Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность. | 25 Мб |
Модели перевода речи
| Идентификатор модели | Description | Максимальный запрос (размер аудиофайла) |
|---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
Модели преобразования текста в речь (предварительная версия)
| Идентификатор модели | Description |
|---|---|
ttsPreview |
Модель преобразования текста в речь, оптимизированная для скорости. |
tts-hdPreview |
Модель преобразования текста в речь, оптимизированная для качества. |
gpt-4o-mini-tts (2025-03-20) |
Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне. |
gpt-4o-mini-tts (2025-12-15) |
Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне. |
Сводка модели и доступность в регионе
Модели по типу развертывания
Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:
- Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
- Provisioned: также имеет глобальный вариант развертывания, позволяющий клиентам приобретать и развертывать единицы пропускной способности с фиксированной пропускной способностью в глобальной инфраструктуре Azure.
Все развертывания могут выполнять те же операции вывода данных, но оплата, масштабируемость и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания .
- Глобальный стандарт
- Глобальная управляемая конфигурация
- Глобальный пакет
- Стандарт зоны данных
- Подготовленная управляемая зона данных
- Пакет зоны данных
- Стандарт
- Сконфигурированное управляемое
Доступность глобальной стандартной модели
| Регион | gpt-5.4-mini, 2026-03-17 | gpt-5.4-nano, 2026-03-17 | gpt-5.4, 2026-03-05 | gpt-5.4-pro, 2026-03-05 | gpt-5.3-chat, 2026-03-03 | gpt-5.3-codex, 2026-02-24 | gpt-audio-1.5, 2026-02-23 | gpt-realtime-1.5, 2026-02-23 | gpt-5.2-chat, 2026-02-10 | gpt-5.2-chat, 2025-12-11 | gpt-5.2-codex, 2026-01-14 | gpt-image-1.5, 2025-12-16 | gpt-4o-mini-transcribe, 2025-12-15 | gpt-4o-mini-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-12-15 | gpt-4o-mini-tts, 2025-03-20 | gpt-audio-mini, 2025-12-15 | gpt-audio-mini, 2025-10-06 | gpt-realtime-mini, 2025-12-15 | gpt-realtime-mini, 2025-10-06 | gpt-5.2, 2025-12-11 | gpt-5.1-codex-max, 2025-12-04 | модель-маршрутизатор, 2025-11-18 | Модель маршрутизатора, 2025-08-07 | модель-маршрутизатор, 2025-05-19 | gpt-5.1, 2025-11-13 | gpt-5.1-chat, 2025-11-13 | gpt-5.1-codex, 2025-11-13 | gpt-5.1-codex-mini, 2025-11-13 | gpt-4o-transcribe-diarize, 2025-10-15 | gpt-5-pro, 2025-10-06 | gpt-image-1-mini, 2025-10-06 | sora-2, 2025-10-06 | gpt-5-chat, 2025-10-03 | gpt-5-chat, 2025-08-07 | gpt-5-codex, 2025-09-15 | gpt-audio, 2025-08-28 | gpt-realtime, 2025-08-28 | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | o3-deep-research, 2025-06-26 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4o-transcribe, 2025-03-20 | предварительный просмотр использования компьютера, 11.03.2025 | computer-use-preview, 11.02.2025 | o3-mini, 2025-01-31 | o1, 2024-12-17 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | text-embedding-ada-002, 2 | text-embedding-3-large, 1 | text-embedding-3-small, 1 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Бразильский Юг | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральная Канада | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - |
| Канада Восток | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральус | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
| Истус | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Германия-запад-центр | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| северная италия | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| japaneast | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Northcentralus | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Норвегия Восток | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Польша Центральная | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Южная Африка-север | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| СаутЦентралус | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southeastasia | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - |
| Южная Индия | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Швейцария север | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| uaenorth | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| UKSOUTH | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Западная Европа | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Вестус | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Замечание
o3-deep-research доступен только с Foundry Agent Service. Дополнительные сведения см. в руководстве по глубокому исследованию.
Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.
Модели встраивания
Эти модели можно использовать только с запросами API внедрения.
Замечание
text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить между моделями внедрения. Чтобы выполнить миграцию с использования text-embedding-ada-002text-embedding-3-large, необходимо создать новые внедрения.
| Идентификатор модели | Максимальный запрос (токены) | Измерения выходных данных | Обучающие данные (до определенного объема) |
|---|---|---|---|
text-embedding-ada-002 (версия 2) |
8,192 | 1,536 | Сентябрь 2021 г. |
text-embedding-ada-002 (версия 1) |
2,046 | 1,536 | Сентябрь 2021 г. |
text-embedding-3-large |
8,192 | 3,072 | Сентябрь 2021 г. |
text-embedding-3-small |
8,192 | 1,536 | Сентябрь 2021 г. |
Замечание
При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.
Модели создания изображений
| Идентификатор модели | Максимальный запрос (символы) |
|---|---|
gpt-image-1 |
4,000 |
gpt-image-1-mini |
4,000 |
gpt-image-1.5 |
4,000 |
Модели создания видео
| Идентификатор модели | Максимальная длина запроса (в символах) |
|---|---|
| sora | 4,000 |
Тонкая настройка моделей
Для точной настройки поддерживаются следующие модели:
| Идентификатор модели | Стандартные регионы | Глобальный | Developer | Методы | Статус | Modality |
|---|---|---|---|---|---|---|
gpt-4o-mini (2024-07-18) |
Северная часть США Центральная Швеция |
✅ | ✅ | SFT | GA | Текст в текст |
gpt-4o (2024-08-06) |
Восточная часть США2 Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст и преобразование изображений в текст |
gpt-4.1 (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст и преобразование изображений в текст |
gpt-4.1-mini (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст в текст |
gpt-4.1-nano (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст в текст |
o4-mini (2025-04-16) |
Восточная часть США2 Центральная Швеция |
✅ | ❌ | RFT | GA | Текст в текст |
gpt-5 (2025-08-07) |
Северная часть США Центральная Швеция |
✅ | ✅ | RFT | Частная предварительная версия | Текст в текст |
Ministral-3B (2411) |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Qwen-32B |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Llama-3.3-70B-Instruct |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
gpt-oss-20b |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Или можно точно настроить ранее настраиваемую модель, отформатированную как base-model.ft-{jobid}.
Замечание
Модели с открытым кодом (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) поддерживаются только в ресурсах Foundry и в новом пользовательском интерфейсе Foundry.
Замечание
Глобальное обучение обеспечивает более доступную стоимость обучения за токен, но не предлагает размещение данных на месте. В настоящее время он доступен для ресурсов Foundry в следующих регионах:
- Australia East
- Бразилия (Юг)
- Центральная Канада
- Canada East
- Восток США
- Восток США2
- Центральная Франция
- Западно-Центральная Германия
- Северная Италия
- Восточная Япония (нет поддержки зрения)
- Центральная Корея
- северо-центральная часть США
- Norway East
- Центральная Польша (нет поддержки 4.1-nano)
- Юго-Восточная Азия
- Север Южной Африки
- Южно-Центральный регион США
- Южная Индия
- Spain Central
- Центральная Швеция
- Switzerland West
- Switzerland North
- UK South
- West Europe
- Западная часть США
- Западная часть США3
Помощники (предварительная версия)
Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. Следующая таблица предназначена для стандартного развертывания. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленная пропускная способность". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать Global Standard модели, если они поддерживаются в следующих регионах.
| Регион | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Предварительный просмотр | gpt-4, 0125-Предварительная версия | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| Истус | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| Норвегия Восток | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| Южная Индия | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| UKSOUTH | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| Вестус | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Вывод модели из эксплуатации
Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.
Связанный контент
Модели Black Forest Labs, проданные непосредственно Azure
Современные модели FLUX от Black Forest Labs (BFL) предлагают передовые возможности генерации изображений на платформе Майкрософт Foundry, позволяя создавать и редактировать высококачественные изображения из текстовых запросов и эталонных изображений. Модели FLUX поддерживают ряд возможностей, включая создание изображений по текстовому описанию, редактирование многоссылочного изображения, а также генерация и редактирование в контексте.
Эти модели можно запускать с помощью API поставщика услуг BFL и через конечные точки images/generations и images/edits.
См. статью Развертывание и использование моделей FLUX в Майкрософт Foundry для работы с моделями FLUX в Foundry.
| Модель | Тип и конечная точка API | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
FLUX.2-flex Preview |
Генерирование изображений - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex |
-
Входные данные: текст и изображение (32 000 маркеров и до 10 изображенийi) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Точное управление; Поддержка нескольких ссылок для до 10 образов - Дополнительные параметры: guidance: определяет, насколько тесно выходные данные соответствуют запросу. Минимум: 1.5, максимум: 10, по умолчанию: 4.5. Выше = более близкое следование указаниям. steps: количество шагов вывода. Максимум: 50, по умолчанию: 50. Выше = больше подробностей, медленнее. |
— глобальный стандарт (все регионы) |
FLUX.2-pro Preview |
Генерирование изображений - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro |
-
Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийii) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Поддержка множественных ссылок для до 8 изображений; более обоснованное на реальных данных; большая гибкость в выводе данных; улучшенная производительность - Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры. |
— глобальный стандарт (все регионы) |
FLUX.1-Kontext-pro Preview |
Генерирование изображений - API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations и https://<resource-name>/openai/deployments/{deployment-id}/images/edits - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
Входные данные: текст и изображение (5000 маркеров и 1 изображение) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Согласованность символов, расширенное редактирование - Дополнительные параметры:(Только api для конкретного поставщика) seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format |
— глобальный стандарт (все регионы) |
FLUX-1.1-pro Preview |
Генерирование изображений - API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
Входные данные: текст (5000 маркеров и 1 изображение) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Быстрый вывод, строгое соблюдение запросов, конкурентное ценообразование, масштабируемая генерация - Дополнительные параметры:(Только api для конкретного поставщика) width, height, , prompt_unsampling, seed, safety_toleranceoutput_format |
— глобальный стандарт (все регионы) |
i,ii Поддержка нескольких эталонных образов доступна для FLUX.2 [pro] (предварительная версия) и FLUX.2 [flex] (предварительная версия) с помощью API, но не на игровой площадке.
Модели Cohere, продающиеся непосредственно через Azure
Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, переранжирование/классификацию текста и векторные представления. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
Cohere-rerank-v4.0-pro |
классификация текста (пересортировка) |
-
Входные данные: текст - Выходные данные: текст - Языки: en, fresitdept-brjazh-cnarvi, , hiruidnl - Вызов инструмента: Нет - Форматы ответов: JSON |
— глобальный стандарт (все регионы) — Управляемые вычисления |
Cohere-rerank-v4.0-fast |
классификация текста (пересортировка) |
-
Входные данные: текст - Выходные данные: текст - Языки: en, fresitdept-brjazh-cnarvi, , hiruidnl - Вызов инструмента: Нет - Форматы ответов: JSON |
— глобальный стандарт (все регионы) — Управляемые вычисления |
Cohere-command-a |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (8 182 токенов) языки - : en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
embed-v-4-0 |
embeddings |
-
Входные данные: текст (512 токенов) и изображения (2MM пикселей) - Вывод: Вектор (256, 512, 1024, 1536 размерности) языки - : en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar |
— глобальный стандарт (все регионы) |
Модели DeepSeek, продаваемые непосредственно через Azure
Семейство моделей DeepSeek включает в себя несколько моделей рассуждений, которые превосходно справляются с задачами на рассуждение благодаря пошаговому процессу обучения, таким как языковые, научные рассуждения и программирование.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
DeepSeek-V3.2-Speciale Preview |
chat-completion (с обоснованием) |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-V3.2 Preview |
chat-completion (с обоснованием) |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-V3.1 Preview |
chat-completion (с обоснованием) |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-R1-0528 Preview |
chat-completion (с обоснованием) |
-
Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
DeepSeek-V3-0324 Preview |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
DeepSeek-R1 |
chat-completion (с обоснованием) |
-
Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
Метамодели, продаваемые напрямую Azure
Модели и инструменты Meta Llama — это коллекция предварительно обученных и точно настроенных генеративных моделей ИИ для работы с текстами и изображениями. Диапазон метамоделей варьируется по масштабу, чтобы включать:
- Небольшие языковые модели (SLM), такие как 1B и 3B Base и модели Instruct, для вывода на устройствах и выводов на периферии.
- Средние крупные языковые модели (LLMs), такие как 7B, 8B и 70B Base и модели Instruct
- Высокопроизводительные модели, такие как Meta Llama 3.1-405B для создания искусственных данных и случаев использования дистилляции.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 Preview |
chat-completion |
-
Входные данные: текст и изображения (маркеры 1M) - Выходные данные: текст (1 млн токенов) - Языки: ar, enfrdehiiditptes, и tlthvi - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
Llama-3.3-70B-Instruct Preview |
chat-completion |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (8 192 токенов) языки - : en, de, fr, it, pt, hi, esи th - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
Некоторые метамодели также доступны от партнеров и сообщества.
Модели Майкрософт, продаваемые непосредственно через Azure
Модели Майкрософт включают различные группы моделей, такие как маршрутизатор моделей, модели MAI, модели Phi, модели ИИ для здравоохранения и многое другое. Также доступны несколько моделей Майкрософт от партнеров и сообщества.
Сведения о работе с моделями преобразования текста в изображение MAI-Image-2e и MAI-Image-2 в Foundry см. в статье Развертывание и использование моделей MAI в Майкрософт Foundry.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
MAI-Image-2e Preview |
Текст к изображению. Дополнительные сведения см. в конечной точке API . |
-
Входные данные: текст - Выход: Один образ - Длина контекста: 32 000 токенов - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG) - Языки: en - Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов. - Параметры: width, , heightprompt Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365). |
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия) |
MAI-Image-2 Preview |
Текст к изображению. Дополнительные сведения см. в конечной точке API . |
-
Входные данные: текст - Выход: Один образ - Длина контекста: 32 000 токенов - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG) - Языки: en - Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов. - Параметры: width, , heightprompt Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365). |
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия) |
model-router
1 |
chat-completion | Дополнительные сведения в разделе Обзор маршрутизатора Model. - Входные данные: текст, изображение - Выходные данные: текст (максимальное количество выходных токенов варьируется2) Окно контекста: 200 0003 - Языки: en |
- Глобальный стандарт (восточная часть США 2, Центральная Швеция) — Зона данных стандарта4 (восточная часть США 2, Центральная Швеция) |
1Версия маршрутизатора2025-11-18. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.
2Максимальное количество токенов на выходе зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).
3 Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.
4 Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.
Модели Mistral, продаваемые непосредственно Azure
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
mistral-document-ai-2512 |
Изображение к тексту |
-
Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки: en - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
mistral-document-ai-2505 Preview |
Изображение к тексту |
-
Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки: en - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
Mistral-Large-3 Preview |
chat-completion |
-
Входные данные: текст, изображение - Выходные данные: текст языки - : en, fr, de, es, it, pt, nl, zh, ja, koи ar - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
Несколько моделей Mistral также доступны от партнеров и сообщества.
Модели ИИ Moonshot продаются непосредственно через Azure
Модели ИИ Moonshot включают мультимодальную модель рассуждения Кими K2.5 предварительная версия, которая принимает текстовый и графический ввод.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
Kimi-K2.5 Preview |
chat-completion (с обоснованием) |
-
Входные данные: текст и изображение (262 144 токенов) - Выходные данные: текст (262 144 токена) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
См. эту коллекцию моделей на портале Foundry.
Модели xAI, проданные непосредственно Azure
Модели Grok в Foundry Models включают разнообразный набор моделей рассуждения и нерассуждения, предназначенных для корпоративных сценариев использования, таких как извлечение данных, кодирование, суммирование текста и агентные приложения.
Регистрация требуется для доступа кgrok-code-fast-1 (предварительная версия) и grok-4.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
grok-4-20-reasoning Preview |
chat-completion |
-
Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4-20-non-reasoning Preview |
chat-completion |
-
Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4.1-fast-reasoning Preview |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4.1-fast-non-reasoning Preview |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4 |
chat-completion |
-
Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4-fast-reasoning Preview |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-4-fast-non-reasoning Preview |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-code-fast-1 Preview |
chat-completion |
-
Входные данные: текст (256 000 маркеров) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-3 Preview |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-3-mini Preview |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
Доступность региона модели по типу развертывания
Модели Foundry позволяют выбрать структуру размещения, которая соответствует вашим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:
- Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
- Provisioned: также имеет глобальный вариант развертывания, позволяющий приобрести и развернуть зарезервированные единицы пропускной способности в глобальной инфраструктуре Azure.
Все развертывания выполняют одни и те же операции вывода, но выставление счетов, масштабирование и производительность отличаются. Дополнительные сведения о типах развертывания см. в разделе "Типы развертывания" в модели Foundry.
Доступность глобальной стандартной модели
| Регион | FLUX.2-flex | FLUX.2-pro | FLUX.1-Kontext-pro | FLUX-1.1-pro | Cohere-rerank-v4.0-pro | Cohere-rerank-v4.0-fast | cohere-command-a | embed-v-4-0 | DeepSeek-V3.2-Speciale | DeepSeek-V3.2 | DeepSeek-V3.1 | DeepSeek-R1-0528 | DeepSeek-V3-0324 | DeepSeek-R1 | Llama-4-Maverick-17B-128E-Instruct-FP8 | Llama-3.3-70B-Instruct | MAI-Image-2 | model-router | mistral-document-ai-2512 | mistral-document-ai-2505 | Mistral-Large-3 | Кими-K2.5 | grok-4-1-fast-reasoning | grok-4-1-fast-non-reasoning | грок-4-быстрое-рассуждение | grok-4-fast-non-reasoning | grok-3 | grok-3-mini |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Бразильский Юг | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральная Канада | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Канада Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Истус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Германия-запад-центр | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| северная италия | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Запад Японии | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Норвегия Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Польша Центральная | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Южная Африка-север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| СаутЦентралус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Южная Индия | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Швейцария север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| UKSOUTH | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Западная Европа | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Вестус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |