Модели Службы Azure OpenAI
Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона. Сведения о GPT-3 и других моделях, поддержка которых прекращается в июле 2024 года, см. в разделе Устаревшие модели службы Azure OpenAI.
Модели | Description |
---|---|
GPT-4 | Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код. |
GPT-3.5 | Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код. |
Внедрение | Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов. |
DALL-E | Серия моделей, которые могут создавать исходные изображения на естественном языке. |
Шепот | Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст. |
Текст для речи (предварительная версия) | Серия моделей в предварительной версии, которая может синтезировать текст для речи. |
GPT-4 и GPT-4 Turbo Preview
GPT-4 — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, GPT-4 оптимизирован для чата и хорошо работает для традиционных задач завершения. Используйте API завершения чата для использования GPT-4. Дополнительные сведения о взаимодействии с GPT-4 и API завершения чата проверка подробное руководство.
GPT-4 Turbo с Vision — это версия GPT-4, которая принимает входные данные изображения. Она доступна в качестве vision-preview
модели gpt-4
.
gpt-4
gpt-4-32k
Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.
GPT-3.5
Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003
API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.
Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата проверка подробное руководство.
Внедрение
text-embedding-3-large
является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002
text-embedding-3-large
к вам потребуется создать новые внедрения.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .
Тест оценки | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Среднее значение MIRACL | 31,4 | 44.0 | 54.9 |
Среднее значение MTEB | 61,0 | 62,3 | 64.6 |
Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions
параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions
не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade
Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002
1536 измерений производительности, остается немного лучше.
DALL-E
Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.
Шепот
Модели Whisper можно использовать для преобразования речи в текст.
Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".
Текст для речи (предварительная версия)
Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.
Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.
Сводная таблица модели и доступность региона
Примечание.
В этой статье рассматривается только доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания Standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Эти таблицы также не применяются к клиентам, использующим только подготовленные типы развертывания, имеющие собственную уникальную матрицу доступности модели или региона. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.
Доступность модели развертывания уровня "Стандартный"
Регион | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | шепет, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Эта таблица не включает точную настройку региональной доступности, обратитесь к выделенному разделу тонкой настройки для этой информации.
Квота модели развертывания уровня "Стандартный"
Квота по умолчанию для моделей зависит от модели и региона. Ограничения квот по умолчанию могут быть изменены.
Квота для стандартных развертываний описывается с точки зрения токенов в минуту (TPM).
Область/регион | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 тыс. | 80 K | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 тыс. | 80 K | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 тыс. | 60 K | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
swedencentral | 40 тыс. | 80 K | 150 K | 30 K | 300 K | 240 K | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
switzerlandnorth | 40 тыс. | 80 K | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1000 токенов в минуту (TPM). Связь между TPM и запросами в минуту (RPM) в настоящее время определяется как 6 RPM на 1000 TPM.
Модели GPT-4 и GPT-4 Turbo Preview
GPT-4, GPT-4-32k и GPT-4 Turbo с Vision теперь доступны всем клиентам Службы Azure OpenAI. Доступность зависит от региона. Если вы не видите модель GPT-4 в своем регионе, проверьте таблицу через некоторое время.
Эти модели можно использовать только с API завершения чата.
GPT-4 версии 0314 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.
Примечание.
Версия 0314
и gpt-4-32k
будет прекращена gpt-4
не раньше 5 июля 2024 г. Версия 0613
и gpt-4-32k
будет прекращена gpt-4
не раньше 30 сентября 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.
GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview. GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
Внимание
gpt-4
Версии 1106-Preview и 0125-Preview будут обновлены с стабильной версиейgpt-4
в будущем. Обновление развертыванияgpt-4
1106-Preview доgpt-4
0125-Preview, запланированное на 8 марта 2024 г. больше не происходит. Развертывания версийgpt-4
1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели. Развертывания версийgpt-4
1106-Preview и 0125-Preview не будут обновлены и перестают работать при обновлении предварительной версии в регионе.
Model ID | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|
gpt-4 (0314) |
8,192 | Сентябрь 2021 г. |
gpt-4-32k (0314) |
32,768 | Сентябрь 2021 г. |
gpt-4 (0613) |
8,192 | Сентябрь 2021 г. |
gpt-4-32k (0613) |
32,768 | Сентябрь 2021 г. |
gpt-4 (1106-preview)1GPT-4 Turbo Preview |
Входные данные: 128 000 Выходные данные: 4096 |
Апрель 2023 г. |
gpt-4 (0125-preview)1GPT-4 Turbo Preview |
Входные данные: 128 000 Выходные данные: 4096 |
Декабрь 2023 г. |
gpt-4 (визуально-предварительная версия)2GPT-4 Turbo с предварительным просмотром визуального зрения |
Входные данные: 128 000 Выходные данные: 4096 |
Апрель 2023 г. |
1 GPT-4 Turbo Preview = gpt-4
(0125-Preview) или gpt-4
(1106-Preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. В разделе "Версия" выберите (0125-Preview) или (1106-Preview).
2 GPT-4 Turbo с Vision Preview = gpt-4
(vision-preview). Чтобы развернуть эту модель, в разделе "Развертывания" выберите gpt-4. Для версии модели выберите vision-preview.
Внимание
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих предварительных версий и стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.
Примечание.
Регионы, в которых GPT-4 (0314) и (0613) перечислены как доступные, имеют доступ к версиям модели 8K и 32K.
Доступность модели GPT-4 и GPT-4 Turbo Preview
Общедоступные облачные регионы
Регион | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
eastus | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
southcentralus | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | ✅ | - | - |
westus | - | ✅ | - | ✅ | - |
Выбор доступа к клиенту
Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:
Модель | Область/регион |
---|---|
gpt-4 (0314) |
Восточная часть США Центральная Франция Южная часть США южная часть Соединенного Королевства |
gpt-4 (0613) |
Восточная часть США Восточная часть США 2 Восточная Япония южная часть Соединенного Королевства |
Регионы Azure для государственных организаций
Следующие модели GPT-4 доступны с Azure для государственных организаций:
Model ID | Доступность модели |
---|---|
gpt-4 (1106-preview) |
US Gov (Вирджиния) US Gov (Аризона) |
Модели GPT-3.5
Внимание
Новая gpt-35-turbo (0125)
модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.
GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.
GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.
Примечание.
Версия 0613
и gpt-35-turbo-16k
будет прекращена gpt-35-turbo
не раньше 1 августа 2024 г. Версия 0301
будет прекращена gpt-35-turbo
не раньше 1 августа 2024 г. Ознакомьтесь с обновлениями моделей для поведения обновления модели.
Model ID | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|
gpt-35-turbo 1 (0301) |
4096 | Сентябрь 2021 г. |
gpt-35-turbo (0613) |
4096 | Сентябрь 2021 г. |
gpt-35-turbo-16k (0613) |
16,384 | Сентябрь 2021 г. |
gpt-35-turbo-instruct (0914) |
4,097 | Сентябрь 2021 г. |
gpt-35-turbo (1106) |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
gpt-35-turbo (0125) NEW |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
Доступность модели GPT-3.5-Turbo
Общедоступные облачные регионы
Регион | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.
Регионы Azure для государственных организаций
Следующие модели turbo GPT-3.5 доступны с Azure для государственных организаций:
Model ID | Доступность модели |
---|---|
gpt-35-turbo (1106-preview) |
US Gov (Вирджиния) |
Модели Embeddings
Эти модели можно использовать только с запросами API внедрения.
Примечание.
text-embedding-3-large
является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002
text-embedding-3-large
к вам, потребуется создать новые внедрения.
Model ID | Максимальный запрос (токены) | Измерения выходных данных | Учебные данные (до) |
---|---|---|---|
text-embedding-ada-002 (версия 2) |
8,191 | 1536 | Сентябрь 2021 г. |
text-embedding-ada-002 (версия 1) |
2,046 | 1536 | Сентябрь 2021 г. |
text-embedding-3-large |
8,191 | 3072 | Сентябрь 2021 г. |
text-embedding-3-small |
8,191 | 1536 | Сентябрь 2021 г. |
Примечание.
При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.
Общедоступные облачные регионы
Регион | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
swedencentral | - | ✅ | - | - |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Регионы Azure для государственных организаций
Следующие модели внедрения доступны с Azure для государственных организаций:
Model ID | Доступность модели |
---|---|
text-embedding-ada-002 (версия 2) |
US Gov (Вирджиния) US Gov (Аризона) |
Модели DALL-E
Model ID | Доступность компонентов | Максимальный запрос (символы) |
---|---|---|
dalle2 (предварительная версия) | Восточная часть США | 1,000 |
dall-e-3 | Восточная часть США, Восточная Австралия, Центральная Швеция | 4000 |
Модели точной настройки
babbage-002
и davinci-002
не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.
gpt-35-turbo
— точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.
Model ID | Точное настройка регионов | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|---|
babbage-002 |
Северная часть США Центральная Швеция Западная Швейцария |
16,384 | Сентябрь 2021 г. |
davinci-002 |
Северная часть США Центральная Швеция Западная Швейцария |
16,384 | Сентябрь 2021 г. |
gpt-35-turbo (0613) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
4096 | Сентябрь 2021 г. |
gpt-35-turbo (1106) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
gpt-35-turbo (0125) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
16,385 | Сентябрь 2021 г. |
Модели Whisper
Model ID | Доступность модели | Максимальный запрос (размер аудиофайла) |
---|---|---|
whisper |
Восточная часть США 2 Северная часть США Восточная Норвегия Южная Индия Центральная Швеция Западная Европа |
25 Мб |
Модели преобразования текста в речь (предварительная версия)
Model ID | Доступность модели |
---|---|
tts-1 |
Северная часть США Центральная Швеция |
tts-1-hd |
Северная часть США Центральная Швеция |
Помощники (предварительная версия)
Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности.
Область/регион | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Восточная Австралия | ✅ | ✅ | ✅ | ✅ | |
Восточная часть США | ✅ | ✅ | |||
Восточная часть США 2 | ✅ | ✅ | ✅ | ||
Центральная Франция | ✅ | ✅ | ✅ | ✅ | |
Восточная Норвегия; | ✅ | ||||
Центральная Швеция | ✅ | ✅ | ✅ | ✅ | |
южная часть Соединенного Королевства | ✅ | ✅ | ✅ | ✅ |