Бөлісу құралы:


Новые возможности Службы Azure OpenAI

В этой статье приводится сводка последних выпусков и основных обновлений документации для Azure OpenAI.

Июнь 2024 г.

GPT-4o выпущено в новых регионах

  • GPT-4o теперь также доступен в:
    • Центральная Швеция для стандартного регионального развертывания.
    • Восточная Япония, Центральная Корея, Центральная Швеция, Северная Швейцария и Западная часть США 3 для подготовки развертывания.

Последние сведения о доступности модели см. на странице моделей.

Поддержка управляемых клиентом ключей (CMK) для помощников

Потоки и файлы в помощниках теперь поддерживают CMK в следующем регионе:

  • Западная часть США — 3

Май 2024 г.

Подготовленные развертывания GPT-4o

gpt-4o Версия: 2024-05-13 доступна как для стандартных, так и подготовленных развертываний. Подготовленные и стандартные развертывания моделей принимают как текстовые, так и запросы вывода изображений и визуального распознавания. Сведения о региональной доступности модели см. в матрице модели для подготовленных развертываний.

Помощники версии 2 (предварительная версия)

Обновление API Помощников теперь доступно в общедоступной среде. Он содержит следующие обновления:

  • Средство поиска файлов и хранилище векторов
  • Максимальная поддержка завершения и максимальной поддержки маркеров запроса для управления использованием маркеров.
  • tool_choiceпараметр для принудительного использования помощником указанного средства. Теперь вы можете создавать сообщения с ролью помощника для создания пользовательских журналов бесед в потоках.
  • temperatureПоддержка параметров , top_presponse_formatпараметров.
  • Поддержка потоковой передачи и опроса. Вспомогательные функции в пакете SDK для Python можно использовать для создания запусков и потоковых ответов. Мы также добавили вспомогательные помощники по пакету SDK для опроса, чтобы предоставить общий доступ к обновлениям состояния объектов без необходимости опроса.
  • Экспериментируйте с logic Apps и вызовом функций с помощью Azure OpenAI Studio. Импортируйте ИНТЕРФЕЙСы REST API, реализованные в Logic Apps в качестве функций, и студия вызывает функцию (как рабочий процесс Logic Apps) автоматически на основе запроса пользователя.
  • AutoGen by Microsoft Research предоставляет платформу общения с несколькими агентами, чтобы обеспечить удобное создание рабочих процессов большой языковой модели (LLM) в широком спектре приложений. Помощники Azure OpenAI теперь интегрированы в AutoGen через GPTAssistantAgentновый экспериментальный агент, который позволяет легко добавлять помощников в рабочие процессы с несколькими агентами на основе автогена. Это позволяет нескольким помощникам Azure OpenAI, которые могут быть задачами или доменами для совместной работы и решения сложных задач.
  • Поддержка точно настроенных gpt-3.5-turbo-0125моделей в следующих регионах:
    • Восточная часть США 2
    • Центральная Швеция
  • Расширенная региональная поддержка :
    • Восточная Япония
    • южная часть Соединенного Королевства
    • западная часть США
    • Западная часть США — 3
    • Восточная Норвегия

Дополнительные сведения см. в записи блога о помощниках.

Общая доступность модели GPT-4o (GA)

GPT-4o ("o для "omni") является последней моделью из OpenAI, запущенной 13 мая 2024 года.

  • GPT-4o интегрирует текст и изображения в одной модели, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером.
  • GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка, и в задачах визуального распознавания, устанавливая новые тесты для возможностей искусственного интеллекта.

Сведения о региональной доступности модели см. на странице моделей.

Глобальный тип развертывания уровня "Стандартный" (предварительная версия)

Глобальные развертывания доступны в одних и том же ресурсах Azure OpenAI, что и не глобальные предложения, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных с наилучшей доступностью для каждого запроса. Глобальный стандарт предоставляет максимальную квоту по умолчанию для новых моделей и устраняет необходимость балансировки нагрузки между несколькими ресурсами.

Дополнительные сведения см. в руководстве по типам развертывания.

Обновление тонкой настройки

Фильтры содержимого DALL-E и GPT-4 Turbo Vision GA

Создайте настраиваемые фильтры содержимого для развертываний DALL-E 2 и 3 и GPT-4 Turbo с ga (gpt-4-turbo-2024-04-09). Фильтрование содержимого

Асинхронный фильтр доступен для всех клиентов Azure OpenAI

Асинхронное выполнение фильтров для улучшения задержки в сценариях потоковой передачи теперь доступно для всех клиентов Azure OpenAI. Фильтрование содержимого

Экраны запросов

Экраны запросов защищают приложения, управляемые моделями Azure OpenAI, из двух типов атак: прямых (с помощью режима тюрьмы) и косвенных атак. Непрямые атаки (также известные как непрямые атаки на запросы или атаки путем внедрения междоменных запросов) — это тип атаки на системы, управляемые моделями генерированного ИИ, которые могут возникать при обработке сведений о приложениях, которые не были непосредственно созданы разработчиком приложения или пользователем. Фильтрование содержимого

Выпуск API 2024-05-01-preview

  • Дополнительные сведения см. в жизненном цикле версии API.

Общая доступность модели GPT-4 Turbo (GA)

Последний выпуск GPT-4 Turbo:

  • gpt-4Версияturbo-2024-04-09.

Это замена для следующих моделей предварительной версии:

  • gpt-4Версия1106-Preview.
  • gpt-4Версия0125-Preview.
  • gpt-4Версияvision-preview.

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

  • Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4версии:turbo-2024-04-09. К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

GPT-4 Turbo подготовленная управляемая доступность

  • gpt-4Версия:turbo-2024-04-09 доступна как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Доступность по регионам

Сведения о региональной доступности модели см. в матрице модели для стандартных и подготовленных развертываний.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

Апрель 2024 г.

Теперь в двух новых регионах восточная часть США 2 и Западная Швейцария поддерживаются

Теперь настройка тонкой настройки доступна с поддержкой:

Восточная часть США 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Западная Швейцария

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Просмотрите страницу моделей, чтобы получить последние сведения о доступности моделей и поддержке точной настройки в каждом регионе.

Примеры обучения чата с несколькими поворотами

Теперь тонкой настройке поддерживаются примеры обучения чата с несколькими поворотами.

GPT-4 (0125) доступен для Azure OpenAI в ваших данных

Теперь модель GPT-4 (0125) можно использовать в доступных регионах с помощью Azure OpenAI в данных.

Март 2024 г.

Мониторинг рисков и безопасности в Azure OpenAI Studio

Azure OpenAI Studio теперь предоставляет панель мониторинга рисков и безопасности для каждого развертывания, использующего конфигурацию фильтра содержимого. Используйте его для проверки результатов действия фильтрации. Затем вы можете настроить конфигурацию фильтра, чтобы лучше обслуживать бизнес-потребности и соответствовать принципам ответственного искусственного интеллекта.

Использование мониторинга рисков и безопасности

Обновление данных в Azure OpenAI

  • Теперь вы можете подключиться к базе данных вектора Elasticsearch, которая будет использоваться с Azure OpenAI On Your Data.
  • Параметр размера блока можно использовать во время приема данных, чтобы задать максимальное количество маркеров любого заданного блока данных в индексе.

Выпущен API общедоступной доступности 2024-02-01

Это последний выпуск ОБЩЕДОСТУПНОго API и является заменой предыдущего 2023-05-15 выпуска общедоступной версии. В этом выпуске добавлена поддержка последних функций Azure OpenAI GA, таких как Whisper, DALLE-3, тонкой настройки данных и т. д.

Функции, которые по-прежнему находятся в предварительной версии, например помощники, текст в речь (TTS), определенные в источниках данных, по-прежнему требуют предварительной версии API. Дополнительные сведения см. в руководстве по жизненному циклу версий API.

Общедоступная версия whisper (GA)

Речь whisper к текстовой модели теперь общедоступна как для REST, так и для Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте выполнить шепет, выполнив краткое руководство.

Общедоступная доступность DALL-E 3

Модель создания образов DALL-E 3 теперь является общедоступной для REST и Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте использовать DALL-E 3, выполнив краткое руководство.

Новая региональная поддержка DALL-E 3

Теперь вы можете получить доступ к DALL-E3 с ресурсом Azure OpenAI в East US регионе AustraliaEast Или регионе Azure, а также SwedenCentral.

Устаревшие модели и выхода на пенсию

Мы добавили страницу для отслеживания устаревших моделей и выхода на пенсию в Службе Azure OpenAI. Эта страница содержит сведения о моделях, доступных в настоящее время, нерекомендуемых и устаревших.

Выпущен API 2024-03-01-preview

2024-03-01-preview имеет все те же функции, что 2024-02-15-preview и добавляет два новых параметра для внедрения:

  • encoding_format позволяет указать формат для создания внедрения в float, или base64. Значение по умолчанию — float.
  • dimensions позволяет задать количество внедрения выходных данных. Этот параметр поддерживается только в новых моделях внедрения третьего поколения: text-embedding-3-large, text-embedding-3-small. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Если вы используете предварительную версию API для использования новейших функций, рекомендуем ознакомиться со статьей жизненного цикла версий API, чтобы отслеживать, сколько времени будет поддерживаться текущая версия API.

Обновление планов обновления GPT-4-1106-Preview

Обновление развертывания gpt-4 1106-Preview до gpt-4 0125-Preview, запланированное на 8 марта 2024 г. больше не происходит. Развертывания версий gpt-4 1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнут обновляться после выпуска стабильной версии модели.

Дополнительные сведения о процессе обновления см. на странице моделей.

Февраль 2024 г.

Доступна модель GPT-3.5-turbo-0125

Эта модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Доступные модели внедрения третьего поколения

  • text-embedding-3-large
  • text-embedding-3-small

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя более высокую производительность для английских задач с тестом MTEB , чем вторая модель внедрения текста-ada-002.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Консолидация квоты GPT-3.5 Turbo

Чтобы упростить миграцию между различными версиями моделей GPT-3.5-Turbo (включая 16k), мы объединим все квоты GPT-3.5-Turbo в одно значение квоты.

  • Все клиенты, у которых утверждена квота, объединены в общую общую квоту, которая отражает предыдущий рост.

  • Любой клиент, текущий общий объем использования в версиях модели которого меньше, чем по умолчанию, по умолчанию получит новую объединенную общую квоту.

Доступна модель GPT-4-0125-preview

Версия gpt-4 модели 0125-preview теперь доступна в Службе Azure OpenAI в регионах "Восточная часть США", "Северная часть США" и "Южная часть США". Клиенты с развертываниями версии 1106-preview будут автоматически обновлены до 0125-preview ближайших gpt-4 недель.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Общедоступная предварительная версия API помощников

Azure OpenAI теперь поддерживает API, который обеспечивает возможности групповой политики OpenAI. Помощники По Azure OpenAI (предварительная версия) позволяют создавать помощники по ИИ, адаптированные к вашим потребностям, с помощью пользовательских инструкций и расширенных средств, таких как интерпретатор кода и пользовательские функции. Дополнительные сведения см. на следующих ресурсах:

Общедоступная предварительная версия текста OpenAI для голосовых голосов

Служба Azure OpenAI теперь поддерживает api-интерфейсы преобразования текста в речь с голосовыми данными OpenAI. Получите речь, созданную СИ, из предоставленного текста. Дополнительные сведения см. в руководстве по обзору и кратком руководстве.

Примечание.

Служба "Речь ИИ Azure" также поддерживает текст OpenAI для голосовой речи. Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Новые возможности настройки и поддержка моделей

Новая региональная поддержка Azure OpenAI в данных

Теперь вы можете использовать Azure OpenAI в данных в следующем регионе Azure:

  • Северная часть ЮАР

Общедоступная доступность Azure OpenAI для ваших данных

Декабрь 2023 г.

Azure OpenAI в данных

  • Полная поддержка VPN и частной конечной точки для Azure OpenAI On Your Data, включая поддержку безопасности для: учетных записей хранения, ресурсов Azure OpenAI и ресурсов ИИ Azure служба .
  • Новая статья по использованию Azure OpenAI On Your Data безопасно защищает данные с помощью виртуальных сетей и частных конечных точек.

GPT-4 Turbo с Vision теперь доступно

GPT-4 Turbo с Vision в службе Azure OpenAI теперь доступна в общедоступной предварительной версии. GPT-4 Turbo с Vision — это большая многомодальная модель (LMM), разработанная OpenAI, которая может анализировать изображения и предоставлять текстовые ответы на вопросы о них. Он включает как обработку естественного языка, так и визуальное понимание. С расширенным режимом вы можете использовать функции Визуального распознавания ИИ Azure для создания дополнительных аналитических сведений на основе изображений.

  • Ознакомьтесь с возможностями GPT-4 Turbo с vision в интерфейсе без кода с помощью игровой площадки Azure OpenAI. Дополнительные сведения см. в руководстве по краткому руководству.
  • Усовершенствование визуального распознавания с помощью GPT-4 Turbo с vision теперь доступно на игровой площадке Azure OpenAI и включает поддержку оптического распознавания символов, заземления объектов, поддержки изображений для "добавления данных" и поддержки видеозаписи.
  • Вызовы API чата непосредственно с помощью REST API.
  • Доступность региона в настоящее время ограничена SwitzerlandNorth, SwedenCentralWestUSиAustraliaEast
  • Узнайте больше об известных ограничениях GPT-4 Turbo с помощью Vision и других часто задаваемых вопросов.

Ноябрь 2023 г.

Поддержка новых источников данных в Azure OpenAI в данных

  • Теперь вы можете использовать Azure Cosmos DB для виртуальных ядер MongoDB, а также URL-адреса или веб-адреса в качестве источников данных для приема данных и чата с поддерживаемой моделью Azure OpenAI.

GPT-4 Turbo Preview и GPT-3.5-Turbo-1106 выпущены

Обе модели являются последним выпуском OpenAI с улучшенными инструкциями, режимом JSON, воспроизводимыми выходными данными и параллельными вызовами функций.

  • GPT-4 Turbo Preview имеет максимальное окно контекста 128 000 маркеров и может создавать 4096 выходных маркеров. В нем есть последние обучающие данные с знаниями до апреля 2023 года. Эта модель находится в предварительной версии и не рекомендуется использовать рабочую среду. Все развертывания этой модели предварительной версии будут автоматически обновляться на месте после того, как стабильный выпуск станет доступным.

  • GPT-3.5-Turbo-1106 имеет максимальное окно контекста 16385 маркеров и может создавать 4096 выходных маркеров.

Сведения о региональной доступности модели см . на странице моделей.

Модели имеют собственные уникальные выделения квот на регион.

Общедоступная предварительная версия DALL-E 3

DALL-E 3 — это последняя модель создания изображений из OpenAI. В нем улучшено качество изображения, более сложные сцены и улучшена производительность при отрисовке текста в изображениях. Он также поставляется с дополнительными параметрами пропорций. DALL-E 3 доступен через OpenAI Studio и через REST API. Ресурс OpenAI должен находиться в регионе SwedenCentral Azure.

DALL-E 3 включает встроенную перезапись запросов для улучшения изображений, уменьшения предвзятости и увеличения естественного изменения.

Попробуйте использовать DALL-E 3, выполнив краткое руководство.

Ответственное применение ИИ

  • Расширенная настраиваемость клиентов: все клиенты Azure OpenAI теперь могут настроить все уровни серьезности (низкие, средние, высокие) для категорий ненависти, насилия, сексуального и самостоятельного вреда, включая фильтрацию только содержимого с высоким уровнем серьезности. Настройка фильтров содержимого

  • Учетные данные содержимого во всех моделях DALL-E: созданные ИИ изображения из всех моделей DALL-E теперь включают цифровые учетные данные, которые раскрывают содержимое в виде искусственного интеллекта. Приложения, отображающие ресурсы изображений, могут использовать пакет SDK открытый код Content Authenticity Initiative для отображения учетных данных в созданных ими образах. Учетные данные содержимого в Azure OpenAI

  • Новые модели RAI

    • Обнаружение рисков в тюрьме: атаки в тюрьме — это запросы пользователей, предназначенные для того, чтобы спровоцировать модель создания искусственного интеллекта в поведении, которое было обучено избежать или нарушить набор правил в системном сообщении. Модель обнаружения рисков в тюрьме необязательна (по умолчанию отключена) и доступна в модели аннотации и фильтрации. Он выполняется в запросах пользователей.
    • Защищенный текст материала: защищенный текст материала описывает известное текстовое содержимое (например, текст песни, статьи, рецепты и выбранное веб-содержимое), которое можно выводить большими языковыми моделями. Защищенная текстовая модель материала является необязательным (по умолчанию отключена) и доступна в модели анотации и фильтрации. Он выполняется в завершениях LLM.
    • Защищенный материальный код: защищенный исходный код описывает исходный код, соответствующий набору исходного кода из общедоступных репозиториев, которые можно выводить большими языковыми моделями без надлежащей ссылки на исходные репозитории. Модель защищенного кода материала является необязательным (по умолчанию отключена) и доступна в модели анотации и фильтрации. Он выполняется в завершениях LLM.

    Настройка фильтров содержимого

  • Блок-списки: клиенты теперь могут быстро настроить поведение фильтра содержимого для запросов и завершения, создав настраиваемый список блокировок в своих фильтрах. Настраиваемый список блокировок позволяет фильтру выполнять действия по настраиваемого списка шаблонов, например определенных терминов или шаблонов регулярных выражений. Помимо настраиваемых списков блокировок, мы предоставляем список блокировок ненормативной лексики Майкрософт (английский). Использование блок-списков

Октябрь 2023

Новые модели тонкой настройки (предварительная версия)

Azure OpenAI в данных

  • Новые настраиваемые параметры для определения количества извлеченных документов и строгости.
    • Параметр строгости задает пороговое значение для классификации документов в соответствии с вашими запросами.
    • Параметр извлеченных документов указывает количество документов с верхней оценкой из индекса данных, используемых для создания ответов.
  • Состояние приема и отправки данных можно просмотреть в Azure OpenAI Studio.
  • Поддержка частных конечных точек и виртуальных сетей для контейнеров BLOB-объектов.

Сентябрь 2023

GPT-4

GPT-4 и GPT-4-32k теперь доступны всем клиентам службы Azure OpenAI. Клиенты больше не должны применяться к списку ожидания для использования GPT-4 и GPT-4-32k (требования к регистрации ограниченного доступа продолжают применяться ко всем моделям Azure OpenAI). Доступность может отличаться по регионам. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

GPT-3.5 Turbo Instruct

Служба Azure OpenAI теперь поддерживает модель структуры Turbo GPT-3.5. Эта модель имеет производительность, сравнимую с text-davinci-003 производительностью и доступной для использования с API завершения. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Whisper public preview

Служба Azure OpenAI теперь поддерживает распознавание речи в текстовые API, созданные моделью Whisper OpenAI. Получите созданный ИИ текст на основе предоставленного вами звука речи. Дополнительные сведения см. в кратком руководстве.

Примечание.

Служба "Речь ИИ Azure" также поддерживает модель Whisper OpenAI с помощью API пакетной транскрибирования. Дополнительные сведения см. в руководстве по созданию пакетной транскрибирования . Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Новые регионы

  • Azure OpenAI теперь также доступен в регионах Швеции Центральной и Северной Швейцарии. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Увеличение ограничений региональной квоты

  • Увеличивается до максимальных ограничений квоты по умолчанию для определенных моделей и регионов. Перенос рабочих нагрузок в эти модели и регионы позволит воспользоваться преимуществами более высоких токенов в минуту (TPM).

Август 2023 г.

Обновления Azure OpenAI для собственных обновлений данных (предварительная версия)

Июль 2023 г.

Поддержка вызовов функций

Увеличение входного массива внедрения

Новые регионы

  • Azure OpenAI теперь также доступен в восточной части Канады, восточной части США 2, Восточной Японии и северной части США. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Июнь 2023 г.

Использование Azure OpenAI для собственных данных (предварительная версия)

  • Azure OpenAI On Your Data теперь доступна в предварительной версии, что позволяет общаться с моделями OpenAI, такими как GPT-35-Turbo и GPT-4, и получать ответы на основе ваших данных.

Новые версии моделей gpt-35-turbo и gpt-4

  • gpt-35-turbo (версия 0613)
  • gpt-35-turbo-16k (версия 0613)
  • gpt-4 (версия 0613)
  • gpt-4-32k (версия 0613)

южная часть Соединенного Королевства

Фильтрация содержимого и заметки (предварительная версия)

Квота

Май 2023 г.

Поддержка пакета SDK java и JavaScript

  • Новые пакеты SDK для Предварительной версии Azure OpenAI, предлагающие поддержку JavaScript и Java.

Общая доступность чата Azure OpenAI (GA)

  • Общая поддержка доступности для:
    • Версия 2023-05-15API завершения чата.
    • Модели GPT-35-Turbo.
    • Серия моделей GPT-4.

Если в настоящее время используется 2023-03-15-preview API, рекомендуется перенести его в API общедоступной версии 2023-05-15 . Если вы используете версию 2022-12-01 API, этот API остается общедоступной, но не включает последние возможности завершения чата.

Внимание

Использование текущих версий моделей GPT-35-Turbo с конечной точкой завершения остается в предварительной версии.

Центральная Франция

Апрель 2023 г.

  • Общедоступная предварительная версия DALL-E 2. Служба Azure OpenAI теперь поддерживает API создания образов на основе модели DALL-E 2 OpenAI. Получите созданные ИИ изображения на основе описательного текста, который вы предоставляете. Дополнительные сведения см. в кратком руководстве. Чтобы запросить доступ, существующие клиенты Azure OpenAI могут применяться, заполнив эту форму.

  • Неактивные развертывания настраиваемых моделей теперь будут удалены через 15 дней; модели останутся доступными для повторного развертывания. Если настраиваемая (настраиваемая) модель развертывается более чем за 15 дней, в течение которых не выполняются или не выполняются вызовы завершения чата, развертывание будет автоматически удалено (и для этого развертывания не будет взиматься дополнительная плата за размещение). Базовая настраиваемая модель останется доступной и может быть развернута в любое время. Дополнительные сведения см. в этой статье.

Март 2023 г.

  • Модели серии GPT-4 теперь доступны в предварительной версии в Azure OpenAI. Чтобы запросить доступ, существующие клиенты Azure OpenAI могут применяться, заполнив эту форму. В настоящее время эти модели доступны в регионах восточной части США и южной части США.

  • Новый API завершения чата для моделей GPT-35-Turbo и GPT-4, выпущенных в предварительной версии 3/21. Чтобы узнать больше о обновленных кратких руководствах и руководствах.

  • GPT-35-Turbo preview. Чтобы узнать больше о руководстве, ознакомьтесь со статьей.

  • Увеличение ограничений на обучение для тонкой настройки: максимальный размер задания обучения (токены в файле обучения) x (# эпох) составляет 2 миллиарда маркеров для всех моделей. Мы также увеличили максимальное число учебных заданий с 120 до 720 часов.

  • Добавление дополнительных вариантов использования в существующий доступ.  Ранее процесс добавления новых вариантов использования требовал от клиентов повторного применения к службе. Теперь мы выпускаем новый процесс, позволяющий быстро добавлять новые варианты использования в службу. Этот процесс следует установленному процессу ограниченного доступа в службах ИИ Azure. Существующие клиенты могут подтвердить все и все новые варианты использования здесь. Обратите внимание, что это необходимо в любое время, когда вы хотите использовать службу для нового варианта использования, к которому вы изначально не применялись.

2023 февраля

Новые возможности

  • Примеры предварительного выпуска | пакета SDK для .NET (вывод)
  • Обновление пакета SDK Terraform для поддержки операций управления Azure OpenAI.
  • Вставка текста в конце завершения теперь поддерживается с параметром suffix .

Обновления

  • Фильтрация содержимого включена по умолчанию.

Новые статьи:

Новый учебный курс:

2023 января

Новые возможности

  • Общедоступная версия службы. Служба Azure OpenAI теперь общедоступна.

  • Новые модели: добавление последней текстовой модели, text-davinci-003 (восточная часть США, Западная Европа), text-ada-embeddings-002 (восточная часть США, южная часть США, Западная Европа)

Декабрь 2022 г.

Новые возможности

  • Последние модели из OpenAI. Azure OpenAI предоставляет доступ ко всем последним моделям, включая серии GPT-3.5.

  • Новая версия API (2022-12-01). Это обновление включает в себя несколько запрошенных улучшений, включая сведения об использовании маркеров в ответе API, улучшенные сообщения об ошибках для файлов, выравнивание с OpenAI при точной настройке структуры данных создания и поддержку параметра суффикса, чтобы разрешить пользовательское именование настраиваемых заданий. ​

  • Более высокие ограничения запросов в секунду. 50 для моделей, отличных от Davinci. 20 для моделей Davinci.

  • Ускоренная настройка развертываний. Разверните модели Ada и Curie в течение 10 минут.

  • Более высокие ограничения на обучение: 40 млн токенов обучения для Ada, Babbage и Curie. 10M для Davinci.

  • Процесс запроса изменений в злоупотреблении и пропустить ведение журнала данных и проверку человека. Сегодня журналы служб запрашивают и отвечают на данные в целях обнаружения злоупотреблений и неправильного использования, чтобы гарантировать, что эти мощные модели не злоупотребляются. Однако многие клиенты имеют строгие требования к конфиденциальности и безопасности данных, требующие большего контроля над данными. Для поддержки этих вариантов использования мы выпускаем новый процесс для клиентов, чтобы изменить политики фильтрации содержимого или отключить ведение журнала злоупотреблений для случаев использования с низким риском. Этот процесс следует установленному процессу ограниченного доступа в службах ИИ Azure, а существующие клиенты OpenAI могут применяться здесь.

  • Шифрование управляемого клиентом ключа (CMK). CMK обеспечивает клиентам больший контроль над управлением данными в Azure OpenAI, предоставляя собственные ключи шифрования, используемые для хранения обучающих данных и настраиваемых моделей. Управляемые клиентом ключи (CMK), которые также называются ключами BYOK, обеспечивают большую гибкость при создании, смене, отключении и отзыве контроля доступа. Они также дают возможность выполнять аудит ключей шифрования, используемых для защиты ваших данных. Дополнительные сведения см. в документации по шифрованию неактивных данных.

  • Поддержка блокировки

  • Соответствие SOC-2

  • Ведение журнала и диагностика с помощью azure Работоспособность ресурсов, анализа затрат и параметров диагностики.

  • Улучшения Студии. Многочисленные улучшения удобства использования рабочего процесса Studio, включая поддержку ролей Azure AD для управления доступом к тем, кто в команде имеет доступ к созданию точно настроенных моделей и развертыванию.

Изменения (критические)

Запрос на создание api тонкой настройки обновлен, чтобы соответствовать схеме OpenAI.

Предварительные версии API:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API версии 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Фильтрация содержимого временно отключена по умолчанию. Azure con режим палатки ration работает не так, как Azure OpenAI. Azure OpenAI запускает фильтры содержимого во время вызова создания, чтобы обнаружить вредное или оскорбительные содержимое и фильтрует их из ответа. Подробнее

Эти модели будут повторно включены в Q1 2023 и будут включены по умолчанию. ​

Действия клиента

Следующие шаги

Ознакомьтесь с дополнительными сведениями о базовых моделях, лежащих в основе Azure OpenAI.