Модели Службы Azure OpenAI

Статья
04/24/2024

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона. Сведения о GPT-3 и других моделях, поддержка которых прекращается в июле 2024 года, см. в разделе Устаревшие модели службы Azure OpenAI.

Модели	Description
GPT-4	Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5	Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение	Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E	Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шепот	Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия)	Серия моделей в предварительной версии, которая может синтезировать текст для речи.

GPT-4 и GPT-4 Turbo Preview

GPT-4 — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, GPT-4 оптимизирован для чата и хорошо работает для традиционных задач завершения. Используйте API завершения чата для использования GPT-4. Дополнительные сведения о взаимодействии с GPT-4 и API завершения чата проверка подробное руководство.

GPT-4 Turbo с Vision — это версия GPT-4, которая принимает входные данные изображения. Она доступна в качестве vision-preview модели gpt-4.

gpt-4
gpt-4-32k

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата проверка подробное руководство.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002text-embedding-3-large к вам потребуется создать новые внедрения.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Среднее значение MIRACL	31,4	44.0	54.9
Среднее значение MTEB	61,0	62,3	64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шепот

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Примечание.

В этой статье рассматривается только доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания Standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Эти таблицы также не применяются к клиентам, использующим только подготовленные типы развертывания, имеющие собственную уникальную матрицу доступности модели или региона. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность модели развертывания уровня "Стандартный"

Регион	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-ada-002, 1	text-embedding-ada-002, 2	text-embedding-3-small, 1	text-embedding-3-large, 1	babbage-002, 1	dall-e-3, 3.0	davinci-002, 1	tts, 001	tts-hd, 001	шепет, 001
australiaeast	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	-	-	-	✅	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
canadaeast	✅	✅	-	-	✅	-	✅	✅	✅	✅	-	-	✅	✅	✅	-	-	-	-	-	-
eastus	-	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	-
eastus2	-	✅	-	-	-	-	✅	-	-	✅	-	-	✅	✅	✅	-	-	-	-	-	✅
francecentral	✅	✅	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
japaneast	-	-	-	✅	-	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
northcentralus	-	-	✅	-	-	-	✅	-	✅	✅	-	-	✅	-	-	✅	-	✅	✅	✅	✅
norwayeast	-	✅	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
southcentralus	-	-	✅	-	-	✅	-	-	✅	-	-	✅	✅	-	-	-	-	-	-	-	-
southindia	-	✅	-	-	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	✅
swedencentral	✅	✅	-	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	-	-	✅	✅	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
uksouth	-	✅	✅	-	-	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
westus	-	✅	-	✅	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-

Эта таблица не включает точную настройку региональной доступности, обратитесь к выделенному разделу тонкой настройки для этой информации.

Квота модели развертывания уровня "Стандартный"

Квота по умолчанию для моделей зависит от модели и региона. Ограничения квот по умолчанию могут быть изменены.

Квота для стандартных развертываний описывается с точки зрения токенов в минуту (TPM).

Область/регион	GPT-4	GPT-4-32K	GPT-4-Turbo	GPT-4-Turbo-V	GPT-35-Turbo	GPT-35-Turbo-Instruct	Text-Embedding-Ada-002	text-embedding-3-small	text-embedding-3-large	Babbage-002	Babbage-002 - finetune	Davinci-002	Davinci-002 - finetune	GPT-35-Turbo - finetune	GPT-35-Turbo-1106 - finetune	GPT-35-Turbo-0125 - finetune
australiaeast	40 тыс.	80 K	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
canadaeast	40 тыс.	80 K	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	-	-	-
eastus	-	-	80 K	-	240 K	240 K	240 K	350 K	350 K	-	-	-	-	-	-	-
eastus2	-	-	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	250 K	250 K	250 K
francecentral	20 тыс.	60 K	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
japaneast	-	-	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
northcentralus	-	-	80 K	-	300 K	-	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
norwayeast	-	-	150 K	-	-	-	350 K	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
southcentralus	-	-	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
southindia	-	-	150 K	-	300 K	-	350 K	-	-	-	-	-	-	-	-	-
swedencentral	40 тыс.	80 K	150 K	30 K	300 K	240 K	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
switzerlandnorth	40 тыс.	80 K	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
switzerlandwest	-	-	-	-	-	-	-	-	-	-	250 K	-	250 K	250 K	250 K	250 K
uksouth	-	-	80 K	-	240 K	-	350 K	-	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
westus	-	-	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-

1 K = 1000 токенов в минуту (TPM). Связь между TPM и запросами в минуту (RPM) в настоящее время определяется как 6 RPM на 1000 TPM.

Модели GPT-4 и GPT-4 Turbo Preview

GPT-4, GPT-4-32k и GPT-4 Turbo с Vision теперь доступны всем клиентам Службы Azure OpenAI. Доступность зависит от региона. Если вы не видите модель GPT-4 в своем регионе, проверьте таблицу через некоторое время.

Эти модели можно использовать только с API завершения чата.

GPT-4 версии 0314 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Примечание.

Версия 0314 и gpt-4-32k будет прекращена gpt-4 не раньше 5 июля 2024 г. Версия 0613 и gpt-4-32k будет прекращена gpt-4 не раньше 30 сентября 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.

GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview. GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.

Внимание

gpt-4 Версии 1106-Preview и 0125-Preview будут обновлены с стабильной версией gpt-4 в будущем. Обновление развертывания gpt-4 1106-Preview до gpt-4 0125-Preview, запланированное на 8 марта 2024 г. больше не происходит. Развертывания версий gpt-4 1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели. Развертывания версий gpt-4 1106-Preview и 0125-Preview не будут обновлены и перестают работать при обновлении предварительной версии в регионе.

Model ID	Максимальный запрос (токены)	Учебные данные (до)
`gpt-4` (0314)	8,192	Сентябрь 2021 г.
`gpt-4-32k`(0314)	32,768	Сентябрь 2021 г.
`gpt-4` (0613)	8,192	Сентябрь 2021 г.
`gpt-4-32k` (0613)	32,768	Сентябрь 2021 г.
`gpt-4` (1106-preview)¹ GPT-4 Turbo Preview	Входные данные: 128 000 Выходные данные: 4096	Апрель 2023 г.
`gpt-4` (0125-preview)¹ GPT-4 Turbo Preview	Входные данные: 128 000 Выходные данные: 4096	Декабрь 2023 г.
`gpt-4` (визуально-предварительная версия)² GPT-4 Turbo с предварительным просмотром визуального зрения	Входные данные: 128 000 Выходные данные: 4096	Апрель 2023 г.

¹ GPT-4 Turbo Preview = gpt-4 (0125-Preview) или gpt-4 (1106-Preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. В разделе "Версия" выберите (0125-Preview) или (1106-Preview).

² GPT-4 Turbo с Vision Preview = gpt-4 (vision-preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. Для версии модели выберите vision-preview.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих предварительных версий и стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Примечание.

Регионы, в которых GPT-4 (0314) и (0613) перечислены как доступные, имеют доступ к версиям модели 8K и 32K.

Доступность модели GPT-4 и GPT-4 Turbo Preview

Общедоступные облачные регионы

Регион	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4-32k, 0613
australiaeast	✅	✅	-	✅	✅
canadaeast	✅	✅	-	-	✅
eastus	-	-	✅	-	-
eastus2	-	✅	-	-	-
francecentral	✅	✅	-	-	✅
japaneast	-	-	-	✅	-
northcentralus	-	-	✅	-	-
norwayeast	-	✅	-	-	-
southcentralus	-	-	✅	-	-
southindia	-	✅	-	-	-
swedencentral	✅	✅	-	✅	✅
switzerlandnorth	✅	-	-	✅	✅
uksouth	-	✅	✅	-	-
westus	-	✅	-	✅	-

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель	Область/регион
`gpt-4` (0314)	Восточная часть США Центральная Франция Южная часть США южная часть Соединенного Королевства
`gpt-4` (0613)	Восточная часть США Восточная часть США 2 Восточная Япония южная часть Соединенного Королевства

Регионы Azure для государственных организаций

Следующие модели GPT-4 доступны с Azure для государственных организаций:

Model ID	Доступность модели
`gpt-4` (1106-preview)	US Gov (Вирджиния) US Gov (Аризона)

Модели GPT-3.5

Внимание

Новая gpt-35-turbo (0125) модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.

GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Примечание.

Версия 0613 и gpt-35-turbo-16k будет прекращена gpt-35-turbo не раньше 1 августа 2024 г. Версия 0301 будет прекращена gpt-35-turbo не раньше 1 августа 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.

Model ID	Максимальный запрос (токены)	Учебные данные (до)
`gpt-35-turbo`¹ (0301)	4096	Сентябрь 2021 г.
`gpt-35-turbo` (0613)	4096	Сентябрь 2021 г.
`gpt-35-turbo-16k` (0613)	16,384	Сентябрь 2021 г.
`gpt-35-turbo-instruct` (0914)	4,097	Сентябрь 2021 г.
`gpt-35-turbo` (1106)	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.
`gpt-35-turbo` (0125) NEW	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.

Доступность модели GPT-3.5-Turbo

Общедоступные облачные регионы

Регион	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914
australiaeast	-	✅	✅	-	✅	-
canadaeast	-	✅	✅	✅	✅	-
eastus	✅	✅	-	-	✅	✅
eastus2	-	✅	-	-	✅	-
francecentral	✅	✅	✅	-	✅	-
japaneast	-	✅	-	-	✅	-
northcentralus	-	✅	-	✅	✅	-
southcentralus	✅	-	-	✅	-	-
southindia	-	-	✅	-	-	-
swedencentral	-	✅	✅	-	✅	✅
switzerlandnorth	-	✅	-	-	✅	-
uksouth	✅	✅	✅	-	✅	-
westeurope	✅	-	-	-	-	-
westus	-	-	✅	-	-	-

¹ Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Регионы Azure для государственных организаций

Следующие модели turbo GPT-3.5 доступны с Azure для государственных организаций:

Model ID	Доступность модели
`gpt-35-turbo` (1106-preview)	US Gov (Вирджиния)

Модели Embeddings

Эти модели можно использовать только с запросами API внедрения.

Примечание.

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002text-embedding-3-large к вам, потребуется создать новые внедрения.

Model ID	Максимальный запрос (токены)	Измерения выходных данных	Учебные данные (до)
`text-embedding-ada-002` (версия 2)	8,191	1536	Сентябрь 2021 г.
`text-embedding-ada-002` (версия 1)	2,046	1536	Сентябрь 2021 г.
`text-embedding-3-large`	8,191	3072	Сентябрь 2021 г.
`text-embedding-3-small`	8,191	1536	Сентябрь 2021 г.

Примечание.

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Общедоступные облачные регионы

Регион	text-embedding-ada-002, 1	text-embedding-ada-002, 2	text-embedding-3-small, 1	text-embedding-3-large, 1
australiaeast	-	✅	-	-
brazilsouth	-	✅	-	-
canadaeast	-	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	-	✅	✅	✅
francecentral	-	✅	-	-
japaneast	-	✅	-	-
northcentralus	-	✅	-	-
norwayeast	-	✅	-	-
southafricanorth	-	✅	-	-
southcentralus	✅	✅	-	-
southindia	-	✅	-	-
swedencentral	-	✅	-	-
switzerlandnorth	-	✅	-	-
uksouth	-	✅	-	-
westeurope	-	✅	-	-
westus	-	✅	-	-
westus3	-	✅	-	-

Регионы Azure для государственных организаций

Следующие модели внедрения доступны с Azure для государственных организаций:

Model ID	Доступность модели
`text-embedding-ada-002` (версия 2)	US Gov (Вирджиния) US Gov (Аризона)

Модели DALL-E

Model ID	Доступность компонентов	Максимальный запрос (символы)
dalle2 (предварительная версия)	Восточная часть США	1,000
dall-e-3	Восточная часть США, Восточная Австралия, Центральная Швеция	4000

Модели точной настройки

babbage-002 и davinci-002 не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.

gpt-35-turbo — точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Model ID	Точное настройка регионов	Максимальный запрос (токены)	Учебные данные (до)
`babbage-002`	Северная часть США Центральная Швеция Западная Швейцария	16,384	Сентябрь 2021 г.
`davinci-002`	Северная часть США Центральная Швеция Западная Швейцария	16,384	Сентябрь 2021 г.
`gpt-35-turbo` (0613)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	4096	Сентябрь 2021 г.
`gpt-35-turbo` (1106)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.
`gpt-35-turbo` (0125)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	16,385	Сентябрь 2021 г.

Модели Whisper

Model ID	Доступность модели	Максимальный запрос (размер аудиофайла)
`whisper`	Восточная часть США 2 Северная часть США Восточная Норвегия Южная Индия Центральная Швеция Западная Европа	25 Мб

Модели преобразования текста в речь (предварительная версия)

Model ID	Доступность модели
`tts-1`	Северная часть США Центральная Швеция
`tts-1-hd`	Северная часть США Центральная Швеция

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности.

Область/регион	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`
Восточная Австралия	✅	✅	✅	✅
Восточная часть США	✅				✅
Восточная часть США 2	✅		✅	✅
Центральная Франция	✅	✅	✅	✅
Восточная Норвегия;				✅
Центральная Швеция	✅	✅	✅	✅
южная часть Соединенного Королевства	✅	✅	✅	✅

Модели Службы Azure OpenAI

GPT-4 и GPT-4 Turbo Preview

GPT-3.5

Внедрение

DALL-E

Шепот

Текст для речи (предварительная версия)

Сводная таблица модели и доступность региона

Доступность модели развертывания уровня "Стандартный"

Квота модели развертывания уровня "Стандартный"

Модели GPT-4 и GPT-4 Turbo Preview

Доступность модели GPT-4 и GPT-4 Turbo Preview

Общедоступные облачные регионы

Выбор доступа к клиенту

Регионы Azure для государственных организаций

Модели GPT-3.5

Доступность модели GPT-3.5-Turbo

Общедоступные облачные регионы

Регионы Azure для государственных организаций

Модели Embeddings

Общедоступные облачные регионы

Регионы Azure для государственных организаций

Модели DALL-E

Модели точной настройки

Модели Whisper

Модели преобразования текста в речь (предварительная версия)

Помощники (предварительная версия)

Следующие шаги

Дополнительные ресурсы