Модели Службы Azure OpenAI

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона. Сведения о GPT-3 и других моделях, поддержка которых прекращается в июле 2024 года, см. в разделе Устаревшие модели службы Azure OpenAI.

Модели Description
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шепот Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия) Серия моделей в предварительной версии, которая может синтезировать текст для речи.

GPT-4 и GPT-4 Turbo Preview

GPT-4 — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, GPT-4 оптимизирован для чата и хорошо работает для традиционных задач завершения. Используйте API завершения чата для использования GPT-4. Дополнительные сведения о взаимодействии с GPT-4 и API завершения чата проверка подробное руководство.

GPT-4 Turbo с Vision — это версия GPT-4, которая принимает входные данные изображения. Она доступна в качестве vision-preview модели gpt-4.

  • gpt-4
  • gpt-4-32k

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата проверка подробное руководство.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002text-embedding-3-large к вам потребуется создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шепот

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Примечание.

В этой статье рассматривается только доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания Standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Эти таблицы также не применяются к клиентам, использующим только подготовленные типы развертывания, имеющие собственную уникальную матрицу доступности модели или региона. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность модели развертывания уровня "Стандартный"

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 шепет, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Эта таблица не включает точную настройку региональной доступности, обратитесь к выделенному разделу тонкой настройки для этой информации.

Квота модели развертывания уровня "Стандартный"

Квота по умолчанию для моделей зависит от модели и региона. Ограничения квот по умолчанию могут быть изменены.

Квота для стандартных развертываний описывается с точки зрения токенов в минуту (TPM).

Область/регион GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 тыс. 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 тыс. 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 тыс. 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
southcentralus - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 тыс. 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 тыс. 80 K - 30 K 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - - - - - 350 K - - - - - - - - -

1 K = 1000 токенов в минуту (TPM). Связь между TPM и запросами в минуту (RPM) в настоящее время определяется как 6 RPM на 1000 TPM.

Модели GPT-4 и GPT-4 Turbo Preview

GPT-4, GPT-4-32k и GPT-4 Turbo с Vision теперь доступны всем клиентам Службы Azure OpenAI. Доступность зависит от региона. Если вы не видите модель GPT-4 в своем регионе, проверьте таблицу через некоторое время.

Эти модели можно использовать только с API завершения чата.

GPT-4 версии 0314 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Примечание.

Версия 0314 и gpt-4-32k будет прекращена gpt-4 не раньше 5 июля 2024 г. Версия 0613 и gpt-4-32k будет прекращена gpt-4 не раньше 30 сентября 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.

GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview. GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.

Внимание

  • gpt-4 Версии 1106-Preview и 0125-Preview будут обновлены с стабильной версией gpt-4 в будущем. Обновление развертывания gpt-4 1106-Preview до gpt-4 0125-Preview, запланированное на 8 марта 2024 г. больше не происходит. Развертывания версий gpt-4 1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели. Развертывания версий gpt-4 1106-Preview и 0125-Preview не будут обновлены и перестают работать при обновлении предварительной версии в регионе.
Model ID Максимальный запрос (токены) Учебные данные (до)
gpt-4 (0314) 8,192 Сентябрь 2021 г.
gpt-4-32k(0314) 32,768 Сентябрь 2021 г.
gpt-4 (0613) 8,192 Сентябрь 2021 г.
gpt-4-32k (0613) 32,768 Сентябрь 2021 г.
gpt-4 (1106-preview)1
GPT-4 Turbo Preview
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4 (0125-preview)1
GPT-4 Turbo Preview
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (визуально-предварительная версия)2
GPT-4 Turbo с предварительным просмотром визуального зрения
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) или gpt-4 (1106-Preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. В разделе "Версия" выберите (0125-Preview) или (1106-Preview).

2 GPT-4 Turbo с Vision Preview = gpt-4 (vision-preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. Для версии модели выберите vision-preview.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих предварительных версий и стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Примечание.

Регионы, в которых GPT-4 (0314) и (0613) перечислены как доступные, имеют доступ к версиям модели 8K и 32K.

Доступность модели GPT-4 и GPT-4 Turbo Preview

Общедоступные облачные регионы

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613
australiaeast -
canadaeast - -
eastus - - - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - - -
norwayeast - - - -
southcentralus - - - -
southindia - - - -
swedencentral -
switzerlandnorth - -
uksouth - - -
westus - - -

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Область/регион
gpt-4 (0314) Восточная часть США
Центральная Франция
Южная часть США
южная часть Соединенного Королевства
gpt-4 (0613) Восточная часть США
Восточная часть США 2
Восточная Япония
южная часть Соединенного Королевства

Регионы Azure для государственных организаций

Следующие модели GPT-4 доступны с Azure для государственных организаций:

Model ID Доступность модели
gpt-4 (1106-preview) US Gov (Вирджиния)
US Gov (Аризона)

Модели GPT-3.5

Внимание

Новая gpt-35-turbo (0125) модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.

GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Примечание.

Версия 0613 и gpt-35-turbo-16k будет прекращена gpt-35-turbo не раньше 1 августа 2024 г. Версия 0301 будет прекращена gpt-35-turbo не раньше 1 августа 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.

Model ID Максимальный запрос (токены) Учебные данные (до)
gpt-35-turbo1 (0301) 4096 Сентябрь 2021 г.
gpt-35-turbo (0613) 4096 Сентябрь 2021 г.
gpt-35-turbo-16k (0613) 16,384 Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) 4,097 Сентябрь 2021 г.
gpt-35-turbo (1106) Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) NEW Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.

Доступность модели GPT-3.5-Turbo

Общедоступные облачные регионы

Регион gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Регионы Azure для государственных организаций

Следующие модели turbo GPT-3.5 доступны с Azure для государственных организаций:

Model ID Доступность модели
gpt-35-turbo (1106-preview) US Gov (Вирджиния)

Модели Embeddings

Эти модели можно использовать только с запросами API внедрения.

Примечание.

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002text-embedding-3-large к вам, потребуется создать новые внедрения.

Model ID Максимальный запрос (токены) Измерения выходных данных Учебные данные (до)
text-embedding-ada-002 (версия 2) 8,191 1536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1536 Сентябрь 2021 г.
text-embedding-3-large 8,191 3072 Сентябрь 2021 г.
text-embedding-3-small 8,191 1536 Сентябрь 2021 г.

Примечание.

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Общедоступные облачные регионы

Регион text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Регионы Azure для государственных организаций

Следующие модели внедрения доступны с Azure для государственных организаций:

Model ID Доступность модели
text-embedding-ada-002 (версия 2) US Gov (Вирджиния)
US Gov (Аризона)

Модели DALL-E

Model ID Доступность компонентов Максимальный запрос (символы)
dalle2 (предварительная версия) Восточная часть США 1,000
dall-e-3 Восточная часть США, Восточная Австралия, Центральная Швеция 4000

Модели точной настройки

babbage-002 и davinci-002 не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.

gpt-35-turbo — точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.

Модели Whisper

Model ID Доступность модели Максимальный запрос (размер аудиофайла)
whisper Восточная часть США 2
Северная часть США
Восточная Норвегия
Южная Индия
Центральная Швеция
Западная Европа
25 Мб

Модели преобразования текста в речь (предварительная версия)

Model ID Доступность модели
tts-1 Северная часть США
Центральная Швеция
tts-1-hd Северная часть США
Центральная Швеция

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности.

Область/регион gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Восточная Австралия
Восточная часть США
Восточная часть США 2
Центральная Франция
Восточная Норвегия;
Центральная Швеция
южная часть Соединенного Королевства

Следующие шаги