Поделиться через


Модели Службы Azure OpenAI

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure для государственных организаций службе OpenAI.

Модели Description
o1-preview и o1-mini Модели ограниченного доступа, специально предназначенные для решения проблем и задач решения проблем с повышенным вниманием и возможностями.
GPT-4o & GPT-4o mini & GPT-4 Turbo Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Звук GPT-4o Модель GPT-4o, поддерживающая низкой задержки, "речь в речи" диалоговых взаимодействий.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шептать Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия) Серия моделей в предварительной версии, которая может синтезировать текст для речи.

ограниченный доступ к моделям o1-preview и o1-mini

Azure OpenAI o1-preview и o1-mini модели специально предназначены для решения задач по устранению причин и решению проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
o1-preview (2024-09-12) Наиболее способная модель в серии o1, предлагающая расширенные возможности рассуждений. Входные данные: 128 000
Выходные данные: 32 768
Октябрь 2023 г.
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. Входные данные: 128 000
Выходные данные: 65 536
Октябрь 2023 г.

Availability

o1-mini Теперь o1-preview доступны модели для доступа к API и развертывания моделей. Регистрация требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт.

Запрос доступа: приложение модели ограниченного доступа

После предоставления доступа необходимо создать развертывание для каждой модели.

поддержка API

Поддержка моделей серии o1 была добавлена в версию 2024-09-01-previewAPI.

Параметр max_tokens устарел и заменен новым max_completion_tokens параметром. Модели серии o1 будут работать только с параметром max_completion_tokens .

Использование

В настоящее время эти модели не поддерживают тот же набор параметров, что и другие модели, использующие API завершения чата. В настоящее время поддерживается только очень ограниченное подмножество, поэтому распространенные параметры, например temperature, top_pнедоступны, и в том числе они вызывают сбой запроса. o1-preview и o1-mini модели также не принимают роль системного сообщения в составе массива сообщений.

Чтобы воспользоваться преимуществами нового max_completion_tokens параметра, может потребоваться обновить версию библиотеки OpenAI Python.

pip install openai --upgrade

Если вы не знакомы с использованием идентификатора Microsoft Entra для проверки подлинности, см . инструкции по настройке Службы Azure OpenAI с проверкой подлинности Идентификатора Microsoft Entra.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Доступность по регионам

Доступно для стандартного и глобального стандартного развертывания в восточной части США, восточной части США2, центрально-северной части США, центрально-южной части США, Центральной Швеции, западной части США и западной части США3 для утвержденных клиентов.

Звук GPT-4o

Модель gpt-4o-realtime-preview является частью семейства моделей GPT-4o и поддерживает низкой задержки, "речь в, речь вне" диалоговых взаимодействий. Звук GPT-4o предназначен для обработки взаимодействия в режиме реального времени, низкой задержки общения, что делает его отличным для агентов поддержки, помощников, переводчиков и других вариантов использования, которые нуждаются в высокой скорости обратной и вперед с пользователем.

Звук GPT-4o доступен в регионах Восточная часть США 2 (eastus2) и Центральная Швеция (swedencentral). Чтобы использовать звук GPT-4o, необходимо создать или использовать существующий ресурс в одном из поддерживаемых регионов.

При создании ресурса можно развернуть звуковую модель GPT-4o. При выполнении программного развертывания имя модели — gpt-4o-realtime-previewэто имя модели. Дополнительные сведения об использовании звука GPT-4o см. в документации по звуку GPT-4o.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-4o-realtime-preview (2024-10-01-preview)
Звук GPT-4o
Звуковая модель для обработки звука в режиме реального времени Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Разделы справки доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

При создании ресурса можно развернуть модели GPT-4o. Если выполняется программное развертывание, имена моделей :

  • gpt-4oВерсия 2024-08-06
  • gpt-4o, версия 2024-05-13
  • gpt-4o-miniВерсия 2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

Последний выпуск GPT-4 Turbo:

  • gpt-4Версия: turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

  • gpt-4Версия: 1106-Preview
  • gpt-4Версия: 0125-Preview
  • gpt-4Версия: vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

  • Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4 версии: turbo-2024-04-09 К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

Внимание

Улучшения визуального распознавания предварительных версий, включая оптическое распознавание символов (OCR), заземление объектов, запросы видео больше не будут доступны после gpt-4 обновления turbo-2024-04-09версииvision-preview. Если вы используете какие-либо из этих предварительных версий функций, это автоматическое обновление модели будет критическим изменением.

GPT-4 Turbo подготовленная управляемая доступность

  • gpt-4Версия: turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4модели. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

  • gpt-4Версия 0314
  • gpt-4Версия 0613
  • gpt-4-32kВерсия 0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Модели GPT-4 и GPT-4 Turbo

  • Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-4o (2024-08-06)
GPT-4o (Omni)
Последняя модель большой общедоступной версии
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
Последняя модель небольшой общедоступной версии
— Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo.
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с vision
Новая модель общедоступной версии
— замена всех предыдущих моделейvision-preview GPT-4 (, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
Предварительная версия модели
-Заменяет 1106-Preview
— повышение производительности создания кода
— уменьшает случаи, когда модель не завершает задачу
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (визуально-предварительная версия)
GPT-4 Turbo с предварительным просмотром визуального зрения
Предварительная версия модели
— принимает входные данные текста и изображения.
— поддерживает улучшения
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4 (1106-preview)
GPT-4 Turbo Preview
Предварительная версия модели
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4-32k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
32,768 Сентябрь 2021 г.
gpt-4 (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
8,192 Сентябрь 2021 г.
gpt-4-32k(0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
32,768 Сентябрь 2021 г.
gpt-4 (0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
8,192 Сентябрь 2021 г.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

  • GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
  • GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
  • GPT-4 — это последняя версия общедоступной версии turbo-2024-04-09 и заменяет , 1106-previewа vision-previewтакже 0125-Preview.

Внимание

Версии GPT-4 (gpt-4) и vision-preview будут обновлены 0125-Preview1106-Previewс стабильной версией gpt-4 в будущем.

  • Развертывания версий gpt-4 1106-Preview0125-Previewи установите для параметра "Автоматическое обновление по умолчанию" и vision-preview "Обновление по истечении срока действия" начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели.
  • Развертывания версий 0125-Preview1106-Previewи vision-preview для параметра "Нет автоматического gpt-4 обновления" не будут обновлены и будут остановляться при обновлении предварительной версии в регионе. Дополнительные сведения о времени обновления см. в статье об отмене использования модели OpenAI в Azure OpenAI.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-35-turbo (0125) NEW Последняя модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
— более высокая точность при реагировании в запрошенных форматах.
— Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (1106) Старая модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения
— замена устаревших моделей завершения
4,097 Сентябрь 2021 г.
gpt-35-turbo-16k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
4096 Сентябрь 2021 г.
gpt-35-turbo1 (0301) Старая модель общедоступной версии
- Сведения о прекращении поддержки
4096 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см . в подробном руководстве.

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002 text-embedding-3-large к вам потребуется создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шептать

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт предлагается с глобальным вариантом развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Подготовка также предоставляется с помощью глобального варианта развертывания, что позволяет клиентам приобретать и развертывать подготовленные единицы пропускной способности в глобальной инфраструктуре Azure.

Все развертывания могут выполнять те же операции вывода, однако выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.

Доступность глобальной стандартной модели

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01 gpt-4, turbo-2024-04-09
australiaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
польшацентральная - - - -
southafricanorth - - - -
southcentralus -
southindia - - - -
spaincentral - - -
swedencentral
switzerlandnorth - - - -
uaenorth - - - -
uksouth - - - -
westeurope - - - -
westus -
westus3 -

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по настройке этих сведений.

Стандартные модели по конечной точке

Завершение чата

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - - - - - -
canadaeast - - - - - - - - -
eastus - - - - -
eastus2 - - - - - -
francecentral - - - - - - - - -
japaneast - - - - - - - - - - - -
northcentralus - - - - - -
norwayeast - - - - - - - - - - - - - - -
southcentralus - - - - - - -
southindia - - - - - - - - - - - - - -
swedencentral - - -
switzerlandnorth - - - - - - - - - - -
uksouth - - - - - - - - -
westeurope - - - - - - - - - - - - - - -
westus - - - - - -
westus3 - - - - - - - -

Доступность модели GPT-4 и GPT-4 Turbo

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Область/регион
gpt-4 (0314)
gpt-4-32k (0314)
Восточная часть США
Центральная Франция
Южная часть США
южная часть Соединенного Королевства
gpt-4 (0613)
gpt-4-32k (0613)
Восточная часть США
Восточная часть США 2
Восточная Япония
южная часть Соединенного Королевства

Модели GPT-3.5

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Модели точной настройки

Примечание.

gpt-35-turbo — Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте AI Studio и не входите в проект.

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4 (0613) 1 Северная часть США
Центральная Швеция
8192 Сентябрь 2021 г.
gpt-4o-mini1 (2024-07-18) Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.
gpt-4o1 (2024-08-06) Восточная часть США2
Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.

1 GPT-4 в настоящее время находится в общедоступной предварительной версии.

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Azure AI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Область/регион gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Восточная Австралия
Восточная часть США
Восточная часть США 2
Центральная Франция
Восточная Япония
Восточная Норвегия;
Центральная Швеция
южная часть Соединенного Королевства
западная часть США
Западная часть США — 3

Прекращение использования модели

Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.

Следующие шаги