Бөлісу құралы:


Модели Службы Azure OpenAI

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure для государственных организаций службе OpenAI.

Модели Description
o1-preview и o1-mini Модели ограниченного доступа, специально предназначенные для решения проблем и задач решения проблем с повышенным вниманием и возможностями.
GPT-4o & GPT-4o mini & GPT-4 Turbo Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Звук GPT-4o Модель GPT-4o, поддерживающая низкой задержки, "речь в речи" диалоговых взаимодействий.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шептать Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия) Серия моделей в предварительной версии, которая может синтезировать текст для речи.

ограниченный доступ к моделям o1-preview и o1-mini

Azure OpenAI o1-preview и o1-mini модели специально предназначены для решения задач по устранению причин и решению проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
o1-preview (2024-09-12) Наиболее способная модель в серии o1, предлагающая расширенные возможности рассуждений. Входные данные: 128 000
Выходные данные: 32 768
Октябрь 2023 г.
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. Входные данные: 128 000
Выходные данные: 65 536
Октябрь 2023 г.

Availability

o1-mini Теперь o1-preview доступны модели для доступа к API и развертывания моделей. Регистрация требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт.

Запрос доступа: приложение модели ограниченного доступа

После предоставления доступа необходимо создать развертывание для каждой модели.

поддержка API

Поддержка моделей серии o1 была добавлена в версию 2024-09-01-previewAPI.

Параметр max_tokens устарел и заменен новым max_completion_tokens параметром. Модели серии o1 будут работать только с параметром max_completion_tokens .

Использование

В настоящее время эти модели не поддерживают тот же набор параметров, что и другие модели, использующие API завершения чата. В настоящее время поддерживается только очень ограниченное подмножество, поэтому распространенные параметры, например temperature, top_pнедоступны, и в том числе они вызывают сбой запроса. o1-preview и o1-mini модели также не принимают роль системного сообщения в составе массива сообщений.

Чтобы воспользоваться преимуществами нового max_completion_tokens параметра, может потребоваться обновить версию библиотеки OpenAI Python.

pip install openai --upgrade

Если вы не знакомы с использованием идентификатора Microsoft Entra для проверки подлинности, см . инструкции по настройке Службы Azure OpenAI с проверкой подлинности Идентификатора Microsoft Entra.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Доступность по регионам

Доступно для стандартного и глобального стандартного развертывания в Восточной части США2 и Швеции Central для утвержденных клиентов.

Звук GPT-4o

Модель gpt-4o-realtime-preview является частью семейства моделей GPT-4o и поддерживает низкой задержки, "речь в, речь вне" диалоговых взаимодействий. Звук GPT-4o предназначен для обработки взаимодействия в режиме реального времени, низкой задержки общения, что делает его отличным для агентов поддержки, помощников, переводчиков и других вариантов использования, которые нуждаются в высокой скорости обратной и вперед с пользователем.

Звук GPT-4o доступен в регионах Восточная часть США 2 (eastus2) и Центральная Швеция (swedencentral). Чтобы использовать звук GPT-4o, необходимо создать или использовать существующий ресурс в одном из поддерживаемых регионов.

При создании ресурса можно развернуть звуковую модель GPT-4o. При выполнении программного развертывания имя модели — gpt-4o-realtime-previewэто имя модели. Дополнительные сведения об использовании звука GPT-4o см. в документации по звуку GPT-4o.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-4o-realtime-preview (2024-10-01-preview)
Звук GPT-4o
Звуковая модель для обработки звука в режиме реального времени Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Разделы справки доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

При создании ресурса можно развернуть модели GPT-4o. Если выполняется программное развертывание, имена моделей :

  • gpt-4oВерсия 2024-08-06
  • gpt-4o, версия 2024-05-13
  • gpt-4o-miniВерсия 2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

Последний выпуск GPT-4 Turbo:

  • gpt-4Версия: turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

  • gpt-4Версия: 1106-Preview
  • gpt-4Версия: 0125-Preview
  • gpt-4Версия: vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

  • Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4 версии: turbo-2024-04-09 К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

GPT-4 Turbo подготовленная управляемая доступность

  • gpt-4Версия: turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4модели. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

  • gpt-4Версия 0314
  • gpt-4Версия 0613
  • gpt-4-32kВерсия 0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Модели GPT-4 и GPT-4 Turbo

  • Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-4o (2024-08-06)
GPT-4o (Omni)
Последняя модель большой общедоступной версии
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
Последняя модель небольшой общедоступной версии
— Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo.
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с vision
Новая модель общедоступной версии
— замена всех предыдущих моделейvision-preview GPT-4 (, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
Предварительная версия модели
-Заменяет 1106-Preview
— повышение производительности создания кода
— уменьшает случаи, когда модель не завершает задачу
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (визуально-предварительная версия)
GPT-4 Turbo с предварительным просмотром визуального зрения
Предварительная версия модели
— принимает входные данные текста и изображения.
— поддерживает улучшения
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4 (1106-preview)
GPT-4 Turbo Preview
Предварительная версия модели
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4-32k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
32,768 Сентябрь 2021 г.
gpt-4 (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
8,192 Сентябрь 2021 г.
gpt-4-32k(0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
32,768 Сентябрь 2021 г.
gpt-4 (0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
8,192 Сентябрь 2021 г.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

  • GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
  • GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
  • GPT-4 — это последняя версия общедоступной версии turbo-2024-04-09 и заменяет , 1106-previewа vision-previewтакже 0125-Preview.

Внимание

Версии GPT-4 (gpt-4) и vision-preview будут обновлены 0125-Preview1106-Previewс стабильной версией gpt-4 в будущем.

  • Развертывания версий gpt-4 1106-Preview0125-Previewи установите для параметра "Автоматическое обновление по умолчанию" и vision-preview "Обновление по истечении срока действия" начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели.
  • Развертывания версий 0125-Preview1106-Previewи vision-preview для параметра "Нет автоматического gpt-4 обновления" не будут обновлены и будут остановляться при обновлении предварительной версии в регионе. Дополнительные сведения о времени обновления см. в статье об отмене использования модели OpenAI в Azure OpenAI.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-35-turbo (0125) NEW Последняя модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
— более высокая точность при реагировании в запрошенных форматах.
— Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (1106) Старая модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения
— замена устаревших моделей завершения
4,097 Сентябрь 2021 г.
gpt-35-turbo-16k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
4096 Сентябрь 2021 г.
gpt-35-turbo1 (0301) Старая модель общедоступной версии
- Сведения о прекращении поддержки
4096 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см . в подробном руководстве.

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002 text-embedding-3-large к вам потребуется создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шептать

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Примечание.

В этой статье рассматривается доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность модели развертывания уровня "Стандартный"

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 шепет, 001
australiaeast - - - - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по настройке этих сведений.

Сведения о квоте по умолчанию см . в статье о квоте и ограничениях.

Доступность подготовленной модели развертывания

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
brazilsouth - - -
canadacentral - - - - - - -
canadaeast - - - -
eastus
eastus2
francecentral - - -
germanywestcentral - - -
japaneast - - - -
koreacentral - - - -
northcentralus
norwayeast - - - - - - -
польшацентральная - -
southafricanorth - - - - -
southcentralus - -
southindia - -
swedencentral
switzerlandnorth -
switzerlandwest - - - - - - - - -
uksouth - -
westus -
westus3 - -

Примечание.

Подготовленная версия версии gpt-4 : turbo-2024-04-09 в настоящее время ограничена только текстом.

Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность глобальной стандартной модели

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01
australiaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus - - -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus - - -
norwayeast - - - -
польшацентральная - - - -
southafricanorth - - - -
southcentralus - - -
southindia - - - -
spaincentral - - - -
swedencentral
switzerlandnorth - - - -
uksouth - - - -
westeurope - - - -
westus - - -
westus3 - - -

Доступность глобально подготовленной управляемой модели

Регион gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18
australiaeast
brazilsouth
canadacentral
canadaeast
eastus
eastus2
francecentral
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
польшацентральная
southafricanorth
southcentralus
southindia
spaincentral
swedencentral
switzerlandnorth
switzerlandwest
uksouth
westeurope
westus
westus3

Доступность глобальной пакетной модели

Регион gpt-4, 0613 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
eastus
swedencentral
westus

Доступность модели GPT-4 и GPT-4 Turbo

Общедоступные облачные регионы

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
australiaeast - - - - -
canadaeast - - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - -
northcentralus - - - -
norwayeast - - - - - - - -
southcentralus - - - -
southindia - - - - - - - -
swedencentral -
switzerlandnorth - - - - - -
uksouth - - - - - - -
westus - - -
westus3 - - - -

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Область/регион
gpt-4 (0314)
gpt-4-32k (0314)
Восточная часть США
Центральная Франция
Южная часть США
южная часть Соединенного Королевства
gpt-4 (0613)
gpt-4-32k (0613)
Восточная часть США
Восточная часть США 2
Восточная Япония
южная часть Соединенного Королевства

Модели GPT-3.5

Внимание

Новая gpt-35-turbo (0125) модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.

GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Доступность модели GPT-3.5-Turbo

Общедоступные облачные регионы

Регион gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus -
eastus2 - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - -
westus3 - - - - -

Модели Embeddings

Эти модели можно использовать только с запросами API внедрения.

Примечание.

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002 text-embedding-3-large к вам, потребуется создать новые внедрения.

Model ID Максимальный запрос (токены) Измерения выходных данных Учебные данные (до)
text-embedding-ada-002 (версия 2) 8,191 1536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1536 Сентябрь 2021 г.
text-embedding-3-large 8,191 3072 Сентябрь 2021 г.
text-embedding-3-small 8,191 1536 Сентябрь 2021 г.

Примечание.

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Общедоступные облачные регионы

Регион text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
norwayeast - -
southafricanorth - - -
southcentralus - -
southindia - -
swedencentral - -
switzerlandnorth - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

Модели DALL-E

Model ID Доступность компонентов Максимальный запрос (символы)
dalle2 (предварительная версия) Восточная часть США 1,000
dall-e-3 Восточная часть США, Восточная Австралия, Центральная Швеция 4000

Модели точной настройки

babbage-002 и davinci-002 не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.

gpt-35-turbo — точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4 (0613) 1 Северная часть США
Центральная Швеция
8192 Сентябрь 2021 г.
gpt-4o-mini1 (2024-07-18) Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.
gpt-4o1 (2024-08-06) Восточная часть США2
Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.

1 GPT-4, GPT-4o и GPT-4o мини-настройка в настоящее время находится в общедоступной предварительной версии. Дополнительные сведения см. в нашем руководстве по оценке безопасности GPT-4, GPT-4o и GPT-4o.

Модели Whisper

Model ID Доступность модели Максимальный запрос (размер аудиофайла)
whisper Восточная часть США 2
Северная часть США
Восточная Норвегия
Южная Индия
Центральная Швеция
Западная Европа
25 Мб

Модели преобразования текста в речь (предварительная версия)

Model ID Доступность модели
tts-1 Северная часть США
Центральная Швеция
tts-1-hd Северная часть США
Центральная Швеция

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Область/регион gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Восточная Австралия
Восточная часть США
Восточная часть США 2
Центральная Франция
Восточная Япония
Восточная Норвегия;
Центральная Швеция
южная часть Соединенного Королевства
западная часть США
Западная часть США — 3

Прекращение использования модели

Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.

Следующие шаги