Новые возможности Azure OpenAI в моделях Azure AI Foundry

2025-07-02

В этой статье приводится сводка последних выпусков и основных обновлений документации для Azure OpenAI.

Июнь 2025 г.

выпущены модели codex-mini и o3-pro

codex-mini и o3-pro теперь доступны. Дополнительные сведения см. на странице "Начало работы с моделями причин"

Май 2025 г.

Выпущено поколение видео Sora (предварительная версия)

Sora (2025-05-02) — это модель создания видео из OpenAI, которая может создавать реалистичные и творческие видео сцены из текстовых инструкций.

Чтобы приступить к работе, следуйте краткому руководству по созданию видео . Дополнительные сведения см. в руководстве по концепциям создания видео .

Выделение для экранов подсказок

Подсветка — это подфункционал экранов запросов, который усиливает защиту от непрямых атак (при помощи внедренных документов), добавляя специальное форматирование в входящие документы для указания на более низкий уровень доверия к модели. Дополнительные сведения см. в документации по фильтру защиты запроса.

Референcный маршрутизатор (тестовая версия)

Маршрутизатор модели для Azure AI Foundry — это разворачиваемая модель чата ИИ, которая автоматически выбирает наилучшую базовую модель чата для ответа на данный запрос. Дополнительные сведения о работе маршрутизатора модели и его преимуществах и ограничениях см. в руководстве по основным понятиям маршрутизатора модели. Чтобы использовать роутер модели с API Completions, следуйте руководству.

Апрель 2025 г.

Поддержка API реального времени (предварительная версия) для WebRTC

API Реального времени (предварительная версия) теперь поддерживает WebRTC, обеспечивая потоковую передачу звука в режиме реального времени и взаимодействие с низкой задержкой. Эта функция идеально подходит для приложений, требующих немедленного отзыва, таких как динамическая поддержка клиентов или интерактивные голосовые помощники. Дополнительные сведения см. в документации по API Реального времени (предварительная версия).

GPT-image-1 выпущен (предварительная версия, ограниченный доступ)

GPT-image-1 (2025-04-15) — это последняя модель создания изображений из Azure OpenAI. Она имеет значительные улучшения по сравнению с DALL-E, включая:

Лучше реагировать на точные указания.
Надежно отображает текст.
Принимает изображения в качестве входных данных, что позволяет создавать новые возможности редактирования и вставки изображений.

Запрос доступа: приложение модели ограниченного доступа

Следуйте инструкциям по генерации изображений, чтобы приступить к работе с новой моделью.

Выпущенные модели o4-mini и o3

модели o4-mini и o3 теперь доступны. Это последние модели рассуждений от Azure OpenAI, предлагающие значительно улучшенные возможности рассуждения, качество и производительность. Дополнительные сведения см. на странице "Начало работы с моделями причин".

Выпущено GPT-4.1

Теперь доступны GPT 4.1 и GPT 4.1-nano. Это последние модели из Azure OpenAI. GPT 4.1 имеет ограничение контекста в 1 миллион токенов. Дополнительные сведения см. на странице моделей.

Выпущены аудиомодели gpt-4o

Теперь доступны новые звуковые модели на базе технологии GPT-4o.

Выпущены модели перевода речи в текст gpt-4o-transcribe и gpt-4o-mini-transcribe. Используйте эти модели через API /audio и /realtime.
Выпущена модель gpt-4o-mini-tts преобразования текста в речь. Используйте модель gpt-4o-mini-tts для создания текстовой речи через API /audio.

Дополнительные сведения о доступных моделях см. в документации по моделям и версиям.

Март 2025 г.

API ответов и модель предварительного просмотра использования компьютера

Responses API — это новый API с сохранением состояния из Azure OpenAI. Он объединяет лучшие возможности из API завершения чата и помощников в одном едином опыте. API ответов также добавляет поддержку новой computer-use-preview модели, которая обеспечивает возможность использования компьютера .

Для доступа к computer-use-preview требуется регистрация, и доступ будет предоставлен на основе критериев приемлемости корпорации Майкрософт. Клиентам, имеющим доступ к другим моделям ограниченного доступа, по-прежнему потребуется запросить доступ к этой модели.

Запрос доступа: computer-use-preview приложение модели ограниченного доступа

Дополнительные сведения о возможностях модели и доступности регионов см. в документации по моделям.

Демонстрационный код интеграции Playwright.

Выделенный резерв (предварительный просмотр)

Spillover управляет изменениями трафика на подготовленных развертываниях, направляя превышения на назначенное стандартное развертывание. Дополнительные сведения о том, как максимизировать использование подготовленных развертываний с помощью перелива трафика, см. Управление трафиком с помощью перелива для подготовленных развертываний (предварительная версия).

Указание конфигураций фильтрации содержимого

Помимо конфигурации фильтрации содержимого на уровне развертывания, теперь мы также предоставляем заголовок запроса, который позволяет указать настраиваемую конфигурацию во время запроса для каждого вызова API. Дополнительные сведения см. в разделе "Использование фильтров содержимого (предварительная версия)".

Февраль 2025 г.

Предварительная версия GPT-4.5

Последняя модель GPT, которая работает с различными задачами текста и изображения, теперь доступна в Azure OpenAI.

Дополнительные сведения о возможностях модели и доступности регионов см. в документации по моделям.

API завершений, хранимых в памяти

Сохраненные завершения позволяют вести историю разговоров из сеансов завершения чата для использования в качестве наборов данных для оценки и дальнейшей настройки.

стандартные развертывания в рамках o3-mini datazone

o3-mini теперь доступен для развертываний по глобальному стандарту и стандартных развертываний зон данных для зарегистрированных клиентов с ограниченным доступом.

Для получения дополнительной информации, ознакомьтесь с нашим руководством по модели рассуждения.

Выпущено аудио gpt-4o mini

Модель gpt-4o-mini-audio-preview (2024-12-17) является последней моделью завершения звука. Дополнительные сведения см. в кратком руководстве по созданию звука.

Модель gpt-4o-mini-realtime-preview (2024-12-17) является самой новой моделью для обработки аудио в реальном времени. Модели реального времени используют ту же базовую звуковую модель GPT-4o, что и API завершения, но оптимизированы для низкой задержки, для взаимодействий со звуком в режиме реального времени. Дополнительные сведения см. в кратком руководстве по звуку в режиме реального времени.

Дополнительные сведения о доступных моделях см. в документации по моделям и версиям.

Январь 2025 г.

o3-mini выпущено

o3-mini (2025-01-31) является последней моделью рассуждений, предлагая расширенные возможности аргументирования. Для получения дополнительной информации, ознакомьтесь с нашим руководством по модели рассуждения.

Завершение звука GPT-4o

Модель gpt-4o-audio-preview теперь доступна для глобальных развертываний в регионах "Восточная часть США 2" и "Центральная Швеция". Используйте модель gpt-4o-audio-preview для создания аудио.

Модель gpt-4o-audio-preview вводит модальность звука в существующий /chat/completions API. Звуковая модель расширяет потенциал для приложений ИИ в взаимодействии с текстом и голосовой связи и анализе звука. Модальности, поддерживаемые в gpt-4o-audio-preview модели, включают: текст, звук и текст + звук. Дополнительные сведения см. в кратком руководстве по созданию звука.

Замечание

API Реального времени использует ту же базовую модель звука GPT-4o, что и API завершения, но оптимизирован для низкой задержки и аудиовзаимодействия в режиме реального времени.

API GPT-4o Realtime 2024-12-17

Модель gpt-4o-realtime-preview версии 2024-12-17 доступна для глобальных развертываний в регионах "Восточная часть США 2" и "Центральная Швеция". gpt-4o-realtime-preview Используйте модель версии 2024-12-17 вместо gpt-4o-realtime-preview модели 2024-10-01-preview для взаимодействия со звуком в режиме реального времени.

Добавлена поддержка кэширования подсказок с помощью модели gpt-4o-realtime-preview.
Добавлена поддержка новых голосов. Модели gpt-4o-realtime-preview теперь поддерживают следующие голоса: "alloy", "ash", "ballad", "coral", "echo", "sage", "shimmer", "verse".
Ограничения скорости больше не зависят от подключений в минуту. Ограничение скорости теперь зависит от RPM (запросов в минуту) и TPM (маркеров в минуту) модели gpt-4o-realtime-preview. Ограничения скорости для каждого развертывания модели gpt-4o-realtime-preview составляют 100 тыс. TPM и 1 тыс. RPM. Во время предварительной версии портал Azure AI Foundry и API могут отображать неточные ограничения скорости. Даже если вы попытаетесь установить другой предел скорости, фактический предел скорости будет составлять 100K TPM и 1K RPM.

Дополнительные сведения см. в кратком руководстве по звуку GPT-4o в режиме реального времени и пошаговом руководстве.

Декабрь 2024 г.

Модель причин o1, выпущенная для ограниченного доступа

Последняя o1 модель теперь доступна для доступа к API и развертывания модели. Регистрация требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт. Клиенты, которые ранее подали заявку и получили доступ к o1-preview, не нужно подавать заявку повторно, так как они автоматически включены в список ожидания на последнюю модель.

Запрос доступа: приложение модели ограниченного доступа

Чтобы узнать больше о расширенных моделях серии o1, см. статью о работе с моделями рассуждений серии o1.

Доступность по регионам

Модель	Регион
`o1` (Версия: 2024-12-17)	Восток США2 (Глобальный стандарт) Центральная Швеция (глобальный стандарт)

Настройка предпочтения (предварительная версия)

Прямая оптимизация предпочтений (DPO) — это новый метод выравнивания для больших языковых моделей, предназначенный для корректировки весов моделей на основе предпочтений человека. В отличие от обучения с подкреплением от человеческой обратной связи (RLHF), DPO не требует настройки модели вознаграждения и использует более простые данные (двоичные предпочтения) для обучения. Этот метод вычисляется легче и быстрее, что делает его одинаково эффективным при выравнивании, а также более эффективным. DPO особенно полезно в сценариях, когда важны субъективные элементы, такие как тон, стиль или определенные предпочтения содержимого. Мы рады объявить о публичном предварительном просмотре DPO в Azure OpenAI, начиная с модели gpt-4o-2024-08-06.

Сведения о доступности региона для точной настройки модели см. на странице моделей.

Сохраненные завершения и дистилляция

Сохраненные завершения позволяют вам фиксировать историю бесед из сеансов завершения чата, чтобы использовать ее как наборы данных для оценок и тонкой настройки.

GPT-4o 2024-11-20

gpt-4o-2024-11-20 теперь доступен для глобального стандартного развертывания в:

Восток США
Восток США 2
северо-центральная часть США
Южно-Центральная часть США
Западная часть США
Западная часть США 3
Центральная Швеция

Новый тип развертывания выделенной зоны данных

Подготовленные зоны данных доступны в том же ресурсе Azure OpenAI, что и все остальные типы развертывания Azure OpenAI, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных в пределах определенной корпорацией Майкрософт зоны данных с оптимальной доступностью для каждого запроса. Развертывания, использующие зоны данных, обеспеченные ресурсами, предоставляют зарезервированную вычислительную мощность для обработки моделей с высокой и прогнозируемой пропускной способностью с использованием инфраструктуры Azure в указанных компанией Microsoft зонах данных. Развертывания с подготовленными зонами данных поддерживаются в моделях gpt-4o-2024-08-06, gpt-4o-2024-05-13 и gpt-4o-mini-2024-07-18.

Дополнительные сведения см. в руководстве по типам развертывания.

Ноябрь 2024 г.

Тонкая настройка Vision GA

Точная настройка с помощью GPT-4o (2024-08-06) теперь доступна в общедоступной версии (GA).

Точная настройка видения позволяет добавлять изображения в обучающие данные JSONL. Как вы можете отправлять одно или несколько изображений для генерации ответов в чате, так и те же типы сообщений можно включить в ваши обучающие данные. Изображения можно предоставлять в виде URL-адресов или изображений в кодировке Base64.

Сведения о доступности региона для точной настройки модели см. на странице моделей.

Новый мониторинг злоупотреблений ИИ

Мы представляем новые формы мониторинга злоупотреблений с использованием моделей LLM для повышения эффективности обнаружения потенциально нежелательного использования Azure OpenAI и обеспечения мониторинга без необходимости человеческого контроля запросов и ответов. Дополнительные сведения см. в статье "Мониторинг злоупотреблений".

Запросы и завершения, помеченные в результате классификации содержимого и/или идентифицированные как часть потенциально оскорбительных шаблонов использования, подвергаются дополнительной проверке для подтверждения анализа системы и принятия решений о действиях. Наши системы мониторинга злоупотреблений были расширены, чтобы по умолчанию включать проверку LLM и людей, когда это необходимо и уместно.

Октябрь 2024 г.

Тип развертывания нового стандартного уровня зоны данных

Стандартные развертывания зоны данных доступны в том же ресурсе Azure OpenAI, что и все остальные типы развертывания Azure OpenAI, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных в пределах определенной корпорацией Майкрософт зоны данных с оптимальной доступностью для каждого запроса. Стандарт зоны данных предоставляет более высокие квоты по умолчанию, чем типы развертывания на основе географии Azure. Развертывания стандартов зоны данных поддерживаются на моделях gpt-4o-2024-08-06, gpt-4o-2024-05-13 и gpt-4o-mini-2024-07-18.

Дополнительные сведения см. в руководстве по типам развертывания.

Глобальная пакетная обработка GA

Теперь общедоступен глобальный пакет Azure OpenAI.

API пакетной службы Azure OpenAI предназначен для эффективной обработки крупномасштабных и больших объемов задач. Обработка асинхронных групп запросов с отдельной квотой, с целевым временем обработки в 24 часа и на 50% меньше затрат, чем глобальный стандарт. При пакетной обработке вместо отправки одного запроса за раз вы отправляете большое количество запросов в одном файле. Глобальные пакетные запросы имеют отдельную квоту токенов в очереди, что позволяет избежать сбоев в работе ваших онлайн-загрузок.

Основные примеры таких ситуаций:

Обработка крупномасштабных данных: быстро анализируйте обширные наборы данных параллельно.
Создание содержимого: создание больших объемов текста, таких как описания продуктов или статьи.
Проверка и сводка документов. Автоматизация проверки и сводки длинных документов.
Автоматизация поддержки клиентов. Обработка многочисленных запросов одновременно для ускорения ответов.
Извлечение и анализ данных. Извлечение и анализ данных из огромных объемов неструктурированных данных.
Задачи обработки естественного языка (NLP): выполнение таких задач, как анализ тональности или перевод больших наборов данных.
Маркетинг и персонализация: Генерация персонализированного контента и рекомендаций в большом масштабе.

Более подробная информация о начале работы с глобальными пакетными развертываниями.

ограниченный доступ к моделям o1-preview и o1-mini

Теперь o1-preview и o1-mini модели доступны для доступа к API и развертывания. Регистрация требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт.

Запрос доступа: приложение модели ограниченного доступа

Клиенты, которые уже утверждены и имеют доступ к модели через площадку предварительного доступа, не нужно подавать заявку повторно, вам автоматически будет предоставлен доступ к API. После предоставления доступа необходимо создать развертывание для каждой модели.

Поддержка API:

Поддержка моделей серии o1 была добавлена в версию 2024-09-01-previewAPI.

Параметр max_tokens устарел и заменен новым max_completion_tokens параметром. Модели серии o1 будут работать только с параметром max_completion_tokens .

Доступность региона:

Модели доступны для стандартного и глобального стандартного развертывания в регионах Восток США2 и Центральная Швеция для утвержденных клиентов.

Новый интерфейс Realtime API GPT-4o для предварительного общедоступного просмотра речи и аудио

Звук Azure OpenAI GPT-4o является частью семейства моделей GPT-4o, которое поддерживает низкую задержку и взаимодействия в формате "голосовой ввод - голосовой вывод". API аудио realtime GPT-4o предназначен для обработки взаимодействий в реальном времени с низкой задержкой, что делает его идеальным решением для использования в сценариях, где требуется живое взаимодействие между пользователем и моделью, например, в области поддержки клиентов, работы голосовых помощников и реальных переводчиков.

Модель gpt-4o-realtime-preview доступна для глобальных развертываний в регионах "Восточная часть США 2" и "Центральная Швеция".

Дополнительные сведения см. в кратком руководстве по звуку GPT-4o в режиме реального времени.

Обновления глобальной пакетной поддержки

Глобальный пакет теперь поддерживает GPT-4o (2024-08-06). Для получения дополнительной информации см. руководство по началу работы с глобальными пакетами.

Сентябрь 2024 г.

Обновления пользовательского интерфейса Azure OpenAI Studio

По состоянию на 19 сентября 2024 г. при переходе в Azure OpenAI Studio вы больше не увидите устаревшую версию Azure OpenAI Studio по умолчанию. Если вам потребуется, вы по-прежнему сможете вернуться к предыдущему интерфейсу с помощью переключателя на старый внешний вид в верхней панели пользовательского интерфейса в течение следующих нескольких недель. Если вы переключитесь на устаревший портал Azure AI Foundry, это поможет вам заполнить форму обратной связи, чтобы сообщить нам, почему. Мы активно отслеживаем эту обратную связь, чтобы улучшить новый интерфейс.

Развертывание GPT-4o, подготовленное на 06.08.2024

GPT-4o 2024-08-06 теперь доступен для подготовленных развертываний в восточной части США, восточной части США 2, северной части США и Центральной Швеции. Это также доступно для глобальных развертываний с выделенными ресурсами.

Последние сведения о доступности модели см. на странице моделей.

НОВЫЙ глобальный предоставленный тип развертывания

Глобальные развертывания доступны в одних и том же ресурсах Azure OpenAI, что и не глобальные типы развертывания, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных с наилучшей доступностью для каждого запроса. Глобальные подготовленные развертывания обеспечивают зарезервированную емкость обработки модели для высокой и прогнозируемой пропускной способности с помощью глобальной инфраструктуры Azure. Глобальные подготовленные развертывания поддерживаются на моделях gpt-4o-2024-08-06 и gpt-4o-mini-2024-07-18.

Дополнительные сведения см. в руководстве по типам развертывания.

НОВЫЕ модели o1-preview и o1-mini, доступные для ограниченного доступа

Модели Azure OpenAI o1-preview и o1-mini предназначены для выполнения задач рассуждения и решения проблем с повышенной сосредоточенностью и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Ключевые возможности серии o1

Сложное создание кода: способен создавать алгоритмы и обрабатывать сложные задачи программирования для поддержки разработчиков.
Расширенное решение проблем: идеально подходит для комплексных сеансов мозгового штурма и решения сложных задач.
Комплексное сравнение документов: идеально подходит для анализа контрактов, файлов дела или юридических документов для выявления тонких различий.
Управление инструкциями и рабочими процессами: особенно эффективно для тех рабочих процессов, которые требуют более коротких контекстов.

Варианты модели

o1-preview: o1-preview — наиболее способная модель в серии o1.
o1-mini: o1-mini это быстрее и дешевле моделей o1 серии.

Версия модели: 2024-09-12

Запрос доступа: приложение модели ограниченного доступа

Ограничения

Модели o1 серии в настоящее время находятся в предварительной версии и не включают некоторые функции, доступные в других моделях, таких как понимание изображений и структурированные выходные данные, доступные в последней модели GPT-4o. Для многих задач общедоступные модели GPT-4o по-прежнему могут быть более подходящими.

Безопасность

OpenAI включил дополнительные меры безопасности в o1 модели, включая новые методы, которые помогут моделям отказаться от небезопасных запросов. Эти улучшения делают ряд моделей o1 одними из самых надежных, которые можно найти.

Доступность

o1-preview и o1-mini доступны в регионе East US2 для ограниченного доступа через портал Azure AI Foundry на площадке раннего доступа. Обработка данных для моделей o1 может происходить в другом регионе, отличном от того, где они доступны для использования.

Чтобы попробовать модели o1-preview и o1-mini в режиме раннего доступа , требуется регистрация, и доступ будет предоставлен на основе критериев отбора компании Microsoft.

Запрос доступа: приложение модели ограниченного доступа

После предоставления доступа вам потребуется:

Перейдите к https://ai.azure.com/resources и выберите ресурс в регионе eastus2 . Если у вас нет ресурса Azure OpenAI в этом регионе, вам потребуется создать его.
eastus2 После выбора ресурса Azure OpenAI на верхней левой панели в разделе "Игровые площадки" выберите "Ранний доступ" (предварительная версия).

Август 2024 г.

Структурированные выходные данные GPT-4o 2024-08-06

Доступно для стандартных и глобальных развертываний во всех регионах США и Центральной Швеции.
Эта модель добавляет поддержку структурированных выходных данных.

Развертывания GPT-4o mini с предустановленными конфигурациями

GPT-4o mini теперь доступен для подготовленных развертываний на востоке Канады, восточной части США, восточной части США2, северной части США и Центральной Швеции.

Последние сведения о доступности модели см. на странице моделей.

Тонкая настройка GPT-4o (Общедоступная версия)

Тонкая настройка GPT-4o теперь доступна в публичном предварительном просмотре для Azure OpenAI в Северной части США и Центральной Швеции.

Дополнительные сведения см. в нашей записи блога.

Новый выпуск API предварительной версии

Версия 2024-07-01-preview API — это последний выпуск API для разработки и выполнения инференса в плоскости данных. Он заменяет версию 2024-05-01-preview API и добавляет поддержку:

Добавлена поддержка пакетного API
Параметры стратегии разбиения хранилища векторов
max_num_results результаты, которые должен вывести инструмент поиска файлов.

Дополнительные сведения см. в нашей справочной документации

Минимальная региональная доступность GPT-4o

GPT-4o mini доступен для стандартного и глобального стандартного развертывания в восточной части США и Центральной Швеции.
GPT-4o mini доступен для глобального пакетного развертывания в регионах "Восточная часть США", "Центральная Швеция" и "Западная часть США".

Руководство по оценке

Новая запись блога о начале работы с оценками моделей. Мы рекомендуем использовать это руководство в рамках процесса обновления модели и выхода на пенсию.

Последняя модель GPT-4o доступна на площадке раннего доступа (демонстрационная версия)

6 августа 2024 года OpenAI объявила о последней версии своей флагманской модели 2024-08-06GPT-4o. GPT-4o 2024-08-06 имеет все возможности предыдущей версии, а также:

Улучшенная возможность поддержки сложных структурированных выходных данных.
Максимальное число выходных маркеров увеличилось с 4096 до 16 384.

Клиенты Azure могут протестировать GPT-4o 2024-08-06 сегодня в новой игровой площадке Azure AI Foundry для раннего доступа (предварительная версия).

В отличие от предыдущей площадки раннего доступа, портал Azure AI Foundry ранний доступ (предварительная версия) не требует наличия ресурса в определенном регионе.

Замечание

Запросы и ответы, сделанные с помощью начальной площадки доступа (предварительная версия), могут обрабатываться в любом регионе Azure OpenAI и в настоящее время подлежат ограничению в 10 запросов в минуту на каждую подписку Azure. Это ограничение может измениться в будущем.

Мониторинг злоупотреблений Azure OpenAI включен для всех пользователей детской площадки раннего доступа, даже если он утвержден для изменения; Фильтры содержимого по умолчанию включены и не могут быть изменены.

Чтобы протестировать GPT-4o 2024-08-06, войдите на тестовую площадку раннего доступа Azure AI (предварительная версия) с помощью этой ссылки.

Теперь доступны глобальные пакетные развертывания

Основные примеры таких ситуаций:

Обработка крупномасштабных данных: быстро анализируйте обширные наборы данных параллельно.
Создание содержимого: создание больших объемов текста, таких как описания продуктов или статьи.
Проверка и сводка документов. Автоматизация проверки и сводки длинных документов.
Автоматизация поддержки клиентов. Обработка многочисленных запросов одновременно для ускорения ответов.
Извлечение и анализ данных. Извлечение и анализ данных из огромных объемов неструктурированных данных.
Задачи обработки естественного языка (NLP): выполнение таких задач, как анализ тональности или перевод больших наборов данных.
Маркетинг и персонализация: Генерация персонализированного контента и рекомендаций в большом масштабе.

Более подробная информация о начале работы с глобальными пакетными развертываниями.

Июль 2024 г.

GPT-4o mini теперь доступен для точной настройки

GPT-4o мини-настройка теперь доступна в общедоступной предварительной версии в Центральной Швеции и Северо-Центральной части США.

Теперь инструмент поиска файлов для помощников облагается платой.

Средство поиска файлов для Помощников теперь имеет дополнительные расходы на использование. Дополнительные сведения см. на странице с ценами.

Мини-модель GPT-4o, доступная для развертывания

GPT-4o mini — это последняя модель Azure OpenAI, объявленная 18 июля 2024 г.:

GPT-4o mini позволяет клиентам предоставлять потрясающие приложения с более низкой стоимостью и молниеносной скоростью. GPT-4o mini более продвинутый, чем GPT-3.5 Turbo — с результатом 82% на измерении возможностей многозадачного языкового понимания (MMLU) против 70%, и более чем на 60% дешевле. Модель обеспечивает расширенное контекстное окно в 128K и интегрирует улучшенные многоязычные возможности GPT-4o, обеспечивая более высокое качество обработки языков со всего мира.

В настоящее время модель доступна как для стандартного, так и глобального стандартного развертывания в регионе "Восточная часть США".

Информация о квоте модели см. на странице квоты и ограничений, и для получения последней информации о доступности модели, см. на странице моделей.

Новая политика фильтрации содержимого по умолчанию для ответственного искусственного интеллекта

Новая политика DefaultV2 фильтрации содержимого по умолчанию обеспечивает последние меры безопасности и безопасности для серии моделей GPT (текст), в том числе:

Щиты для защиты от джейлбрейк-атак на пользовательские запросы (фильтр)
Обнаружение защищенных материалов в тексте с фильтром при завершении модели
Выявление защищённых материалов в коде (аннотация) для завершений модели

Несмотря на отсутствие изменений в фильтрах содержимого для существующих ресурсов и развертываний (по умолчанию или настраиваемых конфигураций фильтрации содержимого остаются неизменными), новые ресурсы и развертывания GPT автоматически наследуют новую политику DefaultV2фильтрации содержимого. Клиенты могут переключаться между значениями по умолчанию безопасности и создавать пользовательские конфигурации фильтрации содержимого.

Дополнительные сведения см. в документации по политике безопасности по умолчанию.

Выпуск новой версии API GA

Версия 2024-06-01 API является самой последней версией API предсказаний общедоступной плоскости данных. Он заменяет версию 2024-02-01 API и добавляет поддержку:

encoding_format встраивания и dimensions параметры.
завершения чата logprobs и top_logprobs параметры.

Ознакомьтесь с нашей справочной документацией по выводам в плоскости данных для получения дополнительной информации.

Расширение регионов, доступных для глобальных стандартных развертываний gpt-4o

GPT-4o теперь доступен для глобальных стандартных развертываний в:

австралиявосток
Бразильский Юг
Канада Восток
Истус
eastus2
Франсцентрал гит
Германия-запад-центр
japaneast
koreacentral
northcentralus
Норвегия Восток
Польша Центральная
Южная Африка-север
СаутЦентралус
Южная Индия
SwedenCentral
Швейцария север
UKSOUTH
Западная Европа
Вестус
westus3

Дополнительные сведения о глобальной стандартной квоте см. на странице квоты и ограничений.

Июнь 2024 г.

Обновления даты выхода на пенсию

Обновлённая gpt-35-turbo дата выхода на пенсию 0301 — не ранее 1 октября 2024 года.
Обновлена gpt-35-turbo и gpt-35-turbo-16k0613 дата выхода на пенсию на 1 октября 2024 г.
Обновлена дата устаревания gpt-4 и gpt-4-32k 0314 до 1 октября 2024 г., а дата вывода из эксплуатации до 6 июня 2025 г.

Ознакомьтесь с нашим руководством по снятию моделей с производства, чтобы получить последние сведения о прекращении их использования и выводе из эксплуатации.

Выставление счетов на основе токенов для точной настройки

Расчет стоимости подгонки Azure OpenAI теперь основан на количестве токенов в учебном файле, а не на общем времени обучения. Это может привести к значительному сокращению затрат на некоторые тренировочные прогоны и значительно упрощает оценку затрат на тонкую настройку. Дополнительные сведения см. в официальном объявлении.

GPT-4o выпущено в новых регионах

GPT-4o теперь также доступен в:
- Центральная Швеция для стандартного регионального развертывания.
- Восточная Австралия, Восточная Канада, Восточная Япония, Центральная Корея, Центральная Швеция, Северная Швейцария и Западная часть США 3 для подготовленного развертывания.

Последние сведения о доступности модели см. на странице моделей.

Поддержка управляемых клиентом ключей (CMK) для помощников

Потоки и файлы в помощниках теперь поддерживают CMK в следующем регионе:

Западная часть США 3

май 2024

Развертывания GPT-4o с выделенными ресурсами

gpt-4o Версия: 2024-05-13 доступна как для стандартных, так и подготовленных развертываний. Настроенные и стандартные модели развертывания принимают запросы на вывод текста и изображений/обработку изображений. Сведения о региональной доступности модели см. в матрице модели для подготовленных развертываний.

Помощники версии 2 (предварительная версия)

Обновление API Помощников теперь доступно в общедоступной среде. Он содержит следующие обновления:

Средство поиска файлов и хранилище векторов
Максимальная завершённость и максимальные запросы для управления использованием токенов.
tool_choice параметр для принудительного использования помощником указанного средства. Теперь вы можете создавать сообщения с ролью помощника для создания пользовательских историй бесед в Threads.
Поддержка параметров temperature, top_p, response_format.
Поддержка потоковой передачи и опроса. Вспомогательные функции в пакете SDK для Python можно использовать для создания запусков и потоковых ответов. Мы также добавили вспомогательные инструменты SDK, чтобы обмениваться обновлениями статуса объектов без необходимости опроса.
Экспериментируйте с logic Apps и вызовом функций с помощью Azure OpenAI Studio. Импортируйте ваши REST API, реализованные в Logic Apps как функции, и студия автоматически вызывает функцию (как рабочий процесс Logic Apps) на основе запроса пользователя.
AutoGen by Microsoft Research предоставляет платформу общения с несколькими агентами, чтобы обеспечить удобное создание рабочих процессов большой языковой модели (LLM) в широком спектре приложений. Помощники Azure OpenAI теперь интегрированы в AutoGen через GPTAssistantAgent, новый экспериментальный агент, который позволяет легко добавлять помощников в рабочие процессы на основе AutoGen с несколькими агентами. Это позволяет нескольким помощникам Azure OpenAI, специализированным по задачам или областям, сотрудничать и решать сложные задачи.
Поддержка точно настроенных gpt-3.5-turbo-0125моделей в следующих регионах:
- Восток США 2
- Центральная Швеция
Расширенная региональная поддержка :
- Восточная Япония
- Юг Соединённого Королевства
- Западная часть США
- Западная часть США 3
- Восточная Норвегия

Дополнительные сведения см. в записи блога о помощниках.

Общая доступность модели GPT-4o (GA)

GPT-4o («o» для «omni») является последней моделью от компании OpenAI, запущенной 13 мая 2024 года.

GPT-4o интегрирует текст и изображения в одной модели, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером.
GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка, и в задачах визуального распознавания, устанавливая новые тесты для возможностей искусственного интеллекта.

Сведения о региональной доступности модели см. на странице моделей.

Глобальный стандартный тип развертывания (предварительно)

Глобальные развертывания доступны в одних и том же ресурсах Azure OpenAI, что и не глобальные предложения, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных с наилучшей доступностью для каждого запроса. Глобальный стандарт предоставляет максимальную квоту по умолчанию для новых моделей и устраняет необходимость балансировки нагрузки между несколькими ресурсами.

Дополнительные сведения см. в руководстве по типам развертывания.

Обновление для тонкой настройки

Тонкая настройка GPT-4 теперь доступна в открытой предварительной версии.
Добавлена поддержка seed, событий, полной статистики валидации и контрольных точек в рамках выпуска 2024-05-01-preview API.

Настраиваемые фильтры содержимого DALL-E и GPT-4 Turbo Vision GA

Создайте настраиваемые фильтры содержимого для развертываний DALL-E 2 и 3, GPT-4 Turbo с Vision в общедоступной версии (turbo-2024-04-09) и GPT-4o. Фильтрование содержимого

Асинхронный фильтр доступен для всех клиентов Azure OpenAI

Асинхронное выполнение фильтров для улучшения задержки в сценариях потоковой передачи теперь доступно для всех клиентов Azure OpenAI. Фильтрование содержимого

Защитные экраны

Экраны запросов защищают приложения, управляемые моделями Azure OpenAI, от двух типов атак: прямых (джейлбрейк) и косвенных. Непрямые атаки (также известные как непрямые атаки на подсказки или атаки внедрения подсказок в междоменных приложениях) — это тип атаки на системы, работающие на генеративных моделях ИИ, которые могут возникать, когда приложение обрабатывает информацию, не созданную непосредственно ни разработчиком, ни пользователем. Фильтрование содержимого

Выпуск предварительной версии API 2024-05-01

Дополнительные сведения см. в жизненном цикле версии API.

Общая доступность модели GPT-4 Turbo (GA)

Последний в общем доступе выпуск GPT-4 Turbo:

gpt-4 Версия:turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

gpt-4 Версия:1106-Preview
gpt-4 Версия:0125-Preview
gpt-4 Версия:vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

Версия новейшей модели turbo от OpenAI поддерживает режим JSON и вызов функций для всех запросов на интерпретацию.
Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов предсказания с входными данными изображения. Текстовые входные запросы (запросы без image_url и встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

Интеграция специфических для Azure AI улучшений Vision с GPT-4 Turbo with Vision не поддерживается для gpt-4версии:turbo-2024-04-09. К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

Это важно

Предварительные функции улучшения визуального распознавания, включая оптическое распознавание символов (OCR), заземление объектов, видеоподсказки, будут прекращены и больше не будут доступны после обновления gpt-4 версии: vision-preview до turbo-2024-04-09. Если вы используете какие-либо из этих предварительных функций, это автоматическое обновление модели будет кардинальным изменением.

Предоставленная управляемая доступность GPT-4 Turbo

gpt-4 Версия:turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с функцией Vision в общедоступной версии.

Чтобы развернуть модель GA на портале Azure AI Foundry, выберите GPT-4, а затем найдите нужную turbo-2024-04-09 версию в раскрывающемся меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

Апрель 2024 г.

Тонкая настройка теперь поддерживается в двух новых регионах: East US 2 и Switzerland West.

Тонкая настройка теперь доступна и предусматривает поддержку:

Восток США 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Западная Швейцария

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Просмотрите страницу моделей, чтобы получить последние сведения о доступности моделей и поддержке точной настройки в каждом регионе.

Примеры обучения многократных чатов

Тонкая настройка теперь поддерживает примеры обучения многократных взаимодействий в чате.

GPT-4 (0125) доступен для Azure OpenAI On Your Data

Теперь вы можете использовать модель GPT-4 (0125) в доступных регионах с помощью Azure OpenAI на ваших данных.

март 2024

Мониторинг рисков и безопасности в Azure OpenAI Studio

Azure OpenAI Studio теперь предоставляет панель мониторинга рисков и безопасности для каждого развертывания, использующего конфигурацию фильтра содержимого. Используйте его для проверки результатов действия фильтрации. Затем вы можете настроить конфигурацию фильтра, чтобы лучше обслуживать бизнес-потребности и соответствовать принципам ответственного искусственного интеллекта.

Риски использования & Мониторинг безопасности

Обновления Azure OpenAI для ваших данных

Теперь вы можете подключиться к базе данных вектора Elasticsearch, которая будет использоваться с Azure OpenAI On Your Data.
Параметр размера куска можно использовать во время приема данных, чтобы задать максимальное количество токенов любого заданного блока данных в индексе.

API общей доступности (GA) выпущен 01.02.2024

Это последний выпуск общедоступного API и является заменой предыдущего 2023-05-15 выпуска общедоступного API. В этом выпуске добавлена поддержка последних функций Azure OpenAI GA, таких как Whisper, DALLE-3, точная настройка данных и многое другое.

Функции, которые находятся на стадии предварительного просмотра, такие как Помощники, текст в речь (TTS) и некоторые источники данных на ваших данных, требуют использования предварительной версии API. Дополнительные сведения см. в руководстве по жизненному циклу версий API.

Общедоступная версия Whisper (GA)

Модель преобразования речи в текст Whisper теперь доступна в общем использовании как для REST, так и для Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте Whisper, следуя краткому руководству.

Общедоступная версия DALL-E 3

Модель генерации изображений DALL-E 3 теперь доступна в общем доступе как для REST, так и для Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте DALL-E 3 с помощью краткого руководства.

Новая региональная поддержка DALL-E 3

Теперь вы можете получить доступ к DALL-E 3 с ресурсом Azure OpenAI в регионе East US или AustraliaEast, а также в SwedenCentral.

Устаревание и вывод моделей из эксплуатации

Мы добавили страницу для отслеживания устаревших моделей и выхода на пенсию в Azure OpenAI. Эта страница содержит сведения о моделях, доступных в настоящее время, нерекомендуемых и устаревших.

Выпущен API версии 2024-03-01-preview

2024-03-01-preview имеет все те же функции, что 2024-02-15-preview и добавляет два новых параметра для внедрения:

encoding_format позволяет указать формат для создания встраивания в float или base64. Значение по умолчанию — float.
dimensions позволяет вам установить количество выходных встраиваний. Этот параметр поддерживается только в новых моделях внедрения третьего поколения: text-embedding-3-large, text-embedding-3-small. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Если вы используете предварительную версию API для использования последних функций, рекомендуем ознакомиться со статьей жизненного цикла версий API, чтобы отслеживать, сколько времени будет поддерживаться текущая версия API.

Обновление планов модернизации до версии GPT-4-1106-Preview

Обновление развертывания gpt-4 1106-Preview до gpt-4 0125-Preview, запланированное на 8 марта 2024 г., больше не состоится. Развертывания версий gpt-4 1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнут обновляться после выпуска стабильной версии модели.

Дополнительные сведения о процессе обновления см. на странице моделей.

Февраль 2024 г.

Доступна модель GPT-3.5-turbo-0125

Эта модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Доступные модели внедрения третьего поколения

text-embedding-3-large
text-embedding-3-small

При тестировании OpenAI сообщает, что как большие, так и маленькие модели встраивания третьего поколения демонстрируют более высокую среднюю производительность в многоязычном извлечении по сравнению с бенчмарком MIRACL, при этом они сохраняют более высокую производительность для английских задач по сравнению с бенчмарком MTEB, чем модель второго поколения text-embedding-ada-002.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Консолидация квоты GPT-3.5 Turbo

Чтобы упростить миграцию между различными версиями моделей GPT-3.5-Turbo (включая 16k), мы объединим все квоты GPT-3.5-Turbo в одно значение квоты.

Любые клиенты, у которых утверждена увеличенная квота, будут иметь объединённую общую квоту, отражающую предыдущие увеличения.
Любой клиент, текущий общий объем использования в версиях модели которого меньше, чем по умолчанию, по умолчанию получит новую объединенную общую квоту.

Модель GPT-4-0125-preview доступна.

Версия gpt-4 модели 0125-preview теперь доступна в Azure OpenAI в регионах "Восточная часть США", "Северная часть США" и "Южная часть США". Клиенты с развертываниями версии gpt-4 будут автоматически обновлены до 1106-preview в течение ближайших недель.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Общедоступная предварительная версия API помощников

Azure OpenAI теперь поддерживает API, который обеспечивает работу моделей OpenAI GPT. Помощники Azure OpenAI (предварительная версия) позволяют создавать ИИ-ассистенты, адаптированные к вашим потребностям, с помощью пользовательских инструкций и расширенных средств, таких как Интерпретатор кода и пользовательские функции. Дополнительные сведения см. на следующих ресурсах:

Предварительная общедоступная версия голосовых моделей OpenAI для озвучивания текста

Azure OpenAI теперь поддерживает API для преобразования текста в речь с использованием голосов OpenAI. Получите речь, созданную СИ, из предоставленного текста. Для получения дополнительных сведений см. обзорное руководство и попробуйте краткое руководство.

Замечание

Сервис Azure AI Speech также поддерживает функции преобразования текста в речь OpenAI. Дополнительные сведения см. в руководстве по голосам text-to-speech OpenAI через Azure OpenAI или Azure AI Speech.

Новые возможности настройки и поддержка моделей

Новая региональная поддержка Azure OpenAI для ваших данных

Теперь вы можете использовать Azure OpenAI в данных в следующем регионе Azure:

Север Южной Африки

Общая доступность Azure OpenAI для ваших данных

Azure OpenAI On Your Data теперь общедоступен.

Декабрь 2023 г.

Azure OpenAI для работы с вашими данными

Полная поддержка VPN и частных конечных точек для Azure OpenAI On Your Data, включая поддержку безопасности для: учетных записей хранения, ресурсов Azure OpenAI и ресурсов сервиса Azure AI Search.
Новая статья по использованию Azure OpenAI On Your Data configuration путем защиты данных с помощью виртуальных сетей и частных конечных точек.

GPT-4 Turbo с Vision теперь доступен

GPT-4 Turbo с функцией Vision в Azure OpenAI теперь доступен для общего предварительного просмотра. GPT-4 Turbo с Vision — это большая многомодальная модель (LMM), разработанная OpenAI, которая может анализировать изображения и предоставлять текстовые ответы на вопросы о них. Он включает как обработку естественного языка, так и визуальное понимание. С расширенным режимом вы можете использовать функции Визуального распознавания ИИ Azure для создания дополнительных аналитических сведений на основе изображений.

Ознакомьтесь с возможностями GPT-4 Turbo с визуальными способностями в среде без необходимости программирования с помощью песочницы Azure OpenAI. Узнайте больше в Руководстве по быстрому старту.
Улучшение визуальных возможностей с использованием GPT-4 Turbo с Vision теперь доступно на тестовой площадке Azure OpenAI и включает поддержку оптического распознавания символов, заземления объектов, поддержку изображений для функции «добавить ваши данные», а также поддержку видеоподсказок.
Производите обращения к API чата напрямую используя REST API.
Доступность регионов в настоящее время ограничена SwitzerlandNorth, SwedenCentral, WestUS и AustraliaEast
Узнайте больше об известных ограничениях GPT-4 Turbo с помощью Vision и других часто задаваемых вопросов.

Ноябрь 2023 г.

Поддержка новых источников данных в Azure OpenAI с вашими данными

Теперь вы можете использовать Azure Cosmos DB для виртуальных ядер MongoDB и URL-адреса или веб-адреса в качестве источников данных для приема данных и чата с поддерживаемой моделью Azure OpenAI.

GPT-4 Turbo Preview и GPT-3.5-Turbo-1106 выпущены

Обе модели являются последним выпуском OpenAI с улучшенными инструкциями, режимом JSON, воспроизводимыми выходными данными и параллельными вызовами функций.

GPT-4 Turbo Preview имеет максимальное окно контекста 128 000 маркеров и может создавать 4096 выходных маркеров. У него имеется самая актуальная обучающая информация, охватывающая период до апреля 2023 года. Эта модель находится в предварительной версии и не рекомендуется для использования в рабочей среде. Все развертывания этой модели предварительной версии будут автоматически обновляться на месте после того, как стабильный выпуск станет доступным.
GPT-3.5-Turbo-1106 имеет максимальное окно контекста 16385 маркеров и может создавать 4096 выходных маркеров.

Для получения информации о региональной доступности моделей, посетите страницу моделей.

Модели имеют собственные уникальные выделения квот на регион.

Общедоступная предварительная версия DALL-E 3

DALL-E 3 — это последняя модель создания изображений из OpenAI. В нем улучшено качество изображения, более сложные сцены и улучшена производительность при отрисовке текста в изображениях. Он также предлагает больше вариантов соотношения сторон. DALL-E 3 доступен через OpenAI Studio и через REST API. Ресурс OpenAI должен находиться в регионе SwedenCentral Azure.

DALL-E 3 включает механизм преобразования запросов для улучшения изображений, снижения предвзятости и увеличения естественного разнообразия.

Попробуйте DALL-E 3 с помощью краткого руководства.

Ответственное применение ИИ

Расширенная настраиваемость клиентов: все клиенты Azure OpenAI теперь могут настроить все уровни серьезности (низкие, средние, высокие) для категорий ненависти, насилия, сексуального и самостоятельного вреда, включая фильтрацию только содержимого с высоким уровнем серьезности. Настройка фильтров содержимого
Сертификаты содержимого во всех моделях DALL-E: созданные ИИ изображения из всех моделей DALL-E теперь включают цифровой сертификат, который указывает, что содержимое создано искусственным интеллектом. Приложения, отображающие ресурсы изображений, могут использовать открытый пакет SDK Content Authenticity Initiative для отображения учетных данных в изображениях, созданных с помощью ИИ. Атрибуты контента в Azure OpenAI
Новые модели RAI
- Обнаружение рисков джейлбрейка: атаки джейлбрейка — это запросы пользователей, предназначенные для того, чтобы спровоцировать генеративную модель ИИ на действие, которое она была обучена избегать, или на нарушение правил, установленных в системном сообщении. Модель для обнаружения рисков джейлбрейка является необязательной (по умолчанию отключена) и доступна в моделях аннотации и фильтрации. Он запускается по командам пользователей.
- Защищенный текст материала: защищенный текст материала описывает известное текстовое содержимое (например, текст песни, статьи, рецепты и выбранное веб-содержимое), которое можно выводить большими языковыми моделями. Текстовая модель для защищенного материала является необязательной (по умолчанию отключена) и доступна в модели аннотирования и фильтрации. Он работает на завершениях LLM.
- Защищенный материальный код: защищенный исходный код описывает исходный код, соответствующий набору исходного кода из общедоступных репозиториев, которые можно выводить большими языковыми моделями без надлежащей ссылки на исходные репозитории. Модель защищенного кода материала является необязательным (по умолчанию отключена) и доступна в модели анотации и фильтрации. Он работает на завершениях LLM.
Настройка фильтров содержимого
Блок-листы: Клиенты теперь могут легко настраивать поведение фильтра контента для подсказок и завершений, создав собственный блок-лист в их фильтрах. Настраиваемый список блокировок позволяет фильтру выполнять действия по настраиваемому списку шаблонов, например, конкретных терминов или шаблонов регулярных выражений. Помимо настраиваемых списков блокировок, мы предоставляем список блокировок ненормативной лексики Майкрософт (английский). Использование блок-списков

Октябрь 2023

Новые модели тонкой настройки (предварительная версия)

gpt-35-turbo-0613 теперь доступен для настройки.
babbage-002 и davinci-002 теперь доступны для точной настройки. Эти модели заменяют устаревшие модели ada, babbage, curie и davinci, которые ранее были доступны для тонкой настройки.
Доступность тонкой настройки ограничена определенными регионами. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.
У точно настроенных моделей есть ограничения квоты, отличные от обычных моделей.
Руководство по тонкой настройке GPT-3.5-Turbo

Azure OpenAI для работы с вашими данными

Новые настраиваемые параметры для определения количества извлеченных документов и строгости.
- Параметр строгости задает пороговое значение для классификации документов в соответствии с вашими запросами.
- Параметр извлеченных документов указывает количество документов с верхней оценкой из индекса данных, используемых для создания ответов.
Состояние приема и отправки данных можно просмотреть в Azure OpenAI Studio.
Поддержка частных конечных точек и VPN для контейнеров BLOB.

Сентябрь 2023 г.

GPT-4

GPT-4 и GPT-4-32k теперь доступны всем клиентам Azure OpenAI. Клиентам больше не нужно подавать заявку на включение в список ожидания для использования GPT-4 и GPT-4-32k (требования к регистрации на ограниченный доступ продолжают применяться ко всем моделям Azure OpenAI). Доступность может отличаться по регионам. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

GPT-3.5 Turbo Instruct

Azure OpenAI теперь поддерживает модель инструкции GPT-3.5 Turbo. Эта модель имеет производительность, сравнимую с text-davinci-003 и доступна для использования с API завершения. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Whisper: общедоступная предварительная версия

Azure OpenAI теперь поддерживает API преобразования речи в текст, работающие на модели Whisper от OpenAI. Получите созданный ИИ текст на основе предоставленного вами звука речи. Чтобы узнать больше, ознакомьтесь с quickstart.

Замечание

Azure AI Speech также поддерживает модель Whisper OpenAI с помощью API пакетной транскрипции. Чтобы узнать больше, ознакомьтесь с руководством Создание пакетной транскрипции. Ознакомьтесь с описанием модели Whisper, чтобы узнать больше о том, когда использовать службы Azure AI Speech и Azure OpenAI.

Новые регионы

Azure OpenAI теперь также доступен в регионах Швеции Центральной и Северной Швейцарии. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Увеличение ограничений региональной квоты

Увеличение максимальных пределов квот по умолчанию для определённых моделей и регионов. Перенос рабочих нагрузок в эти модели и регионы позволит воспользоваться преимуществами более высоких токенов в минуту (TPM).

Август 2023 г.

Обновления Azure OpenAI для работы с вашими данными (предварительная версия)

Теперь вы можете развернуть Azure OpenAI на ваших данных в Power Virtual Agents.
Azure OpenAI On Your Data теперь поддерживает частные конечные точки.
Возможность фильтрации доступа к конфиденциальным документам.
Автоматическое обновление индекса по расписанию.
Параметры поиска векторов и семантического поиска.
Просмотр журнала чата в развернутом веб-приложении

Июль 2023 г.

Поддержка вызова функций

Azure OpenAI теперь поддерживает вызов функций для работы с функциями в API завершения чата.

Увеличение входного массива для встраивания

Azure OpenAI теперь поддерживает массивы с до 16 входов на запрос API в версии 2 text-embedding-ada-002.

Новые регионы

Azure OpenAI теперь также доступен в восточной части Канады, восточной части США 2, Восточной Японии и северной части США. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Июнь 2023 г.

Использование Azure OpenAI для собственных данных (предварительная версия)

Azure OpenAI On Your Data теперь доступна в предварительной версии, что позволяет общаться с моделями OpenAI, такими как GPT-35-Turbo и GPT-4, и получать ответы на основе ваших данных.

Новые версии моделей gpt-35-turbo и gpt-4

gpt-35-turbo (версия 0613)
gpt-35-turbo-16k (версия 0613)
gpt-4 (версия 0613)
gpt-4-32k (версия 0613)

Юг Соединённого Королевства

Azure OpenAI теперь доступен в южном регионе Великобритании. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Фильтрация содержимого и заметки (предварительная версия)

Квота

Квоты обеспечивают гибкость для активного управления распределением ограничений на скорость между различными развертываниями в вашей подписке.

Май 2023 г.

Поддержка пакета SDK java и JavaScript

Новые пакеты SDK для Предварительной версии Azure OpenAI, предлагающие поддержку JavaScript и Java.

Общая доступность завершения чата Azure OpenAI (GA)

Общая поддержка доступности для:
- Версия 2023-05-15API завершения чата.
- Модели GPT-35-Turbo.
- Серия моделей GPT-4.

Если вы в настоящее время используете 2023-03-15-preview API, мы рекомендуем перейти на GA 2023-05-15 API. Если вы используете версию API 2022-12-01, данный API остается в общем доступе, но не включает последние функции завершения чата.

Это важно

Использование текущих версий моделей GPT-35-Turbo с конечной точкой завершения остаётся в режиме предварительного просмотра.

Центральная Франция

Azure OpenAI теперь доступен в центральном регионе Франции. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Апрель 2023 г.

Общедоступная предварительная версия DALL-E 2. Azure OpenAI теперь поддерживает API создания образов, созданные на основе модели OpenAI DALL-E 2. Получите созданные ИИ изображения на основе описательного текста, который вы предоставляете. Чтобы узнать больше, ознакомьтесь с quickstart.
Неактивные развертывания настраиваемых моделей теперь будут удалены через 15 дней; модели останутся доступными для повторного развертывания. Если настраиваемая модель развертывается более чем на 15 дней, в течение которых не выполняются вызовы завершений или завершений чата, развертывание будет автоматически удалено, и плата за размещение взиматься не будет. Базовая настраиваемая модель останется доступной и может быть развернута в любое время. Дополнительные сведения см. в руководстве.

Март 2023 г.

Модели серии GPT-4 теперь доступны в предварительной версии в Azure OpenAI. Чтобы запросить доступ, существующие клиенты Azure OpenAI могут подать заявку, заполнив эту форму. В настоящее время эти модели доступны в регионах восточной части США и южной части США.
Новый API завершения чата для моделей GPT-35-Turbo и GPT-4, выпущен в предварительной версии 21 марта. Дополнительные сведения см. в обновленных кратких руководствах и инструкции.
GPT-35-Turbo preview. Дополнительные сведения см. в статье с инструкциями.
Увеличены лимиты на обучение для тонкой настройки: максимальный размер задания обучения (маркеры в файле обучения) x (число эпох) составляет 2 миллиарда маркеров для всех моделей. Мы также увеличили максимальное число учебных заданий с 120 до 720 часов.
Добавление дополнительных сценариев использования к вашему существующему доступу. Ранее процесс добавления новых вариантов использования требовал от клиентов повторного обращения в службу. Теперь мы выпускаем новый процесс, который позволяет вам быстро добавлять новые варианты использования в ваше использование сервиса. Этот процесс следует установленному процессу ограниченного доступа в Azure OpenAI. Существующие клиенты могут подтвердить все и все новые варианты использования здесь. Обратите внимание, что это требуется в любом случае, когда вы хотите использовать сервис для нового варианта использования, на который вы изначально не подавали заявку.

Февраль 2023