Поделиться через


Развертывание моделей Azure OpenAI с помощью Azure AI Studio

Внимание

Некоторые функции, описанные в этой статье, могут быть доступны только в предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Из этой статьи вы узнаете, как создать развертывания модели Azure OpenAI в Azure AI Studio.

Служба Azure OpenAI предлагает разнообразный набор моделей с разными возможностями и ценовыми точками. При развертывании моделей Azure OpenAI в Azure AI Studio можно использовать развертывания, используя поток запроса или другое средство. Доступность модели зависит от региона. Дополнительные сведения о каждой модели см. в разделе Модели Службы Azure OpenAI.

Чтобы изменить и взаимодействовать с моделью Azure OpenAI на детской площадке Azure AI Studio , сначала необходимо развернуть базовую модель Azure OpenAI в проекте. После развертывания и доступности модели в проекте можно использовать конечную точку REST API как есть или настроить дальше с собственными данными и другими компонентами (внедрение, индексы и многое другое).

Развертывание модели Azure OpenAI из каталога моделей

Выполните следующие действия, чтобы развернуть модель Azure OpenAI, например gpt-4 в конечной точке в режиме реального времени из каталога моделей AI Studio:

  1. Войдите в AI Studio и перейдите на домашнюю страницу.

  2. Выберите каталог моделей на левой боковой панели.

  3. В фильтре коллекций выберите Azure OpenAI.

    Снимок экрана: фильтрация по моделям Azure OpenAI в каталоге.

  4. Выберите модель, gpt-4 например из коллекции Azure OpenAI.

  5. Выберите "Развернуть" , чтобы открыть окно развертывания.

  6. Выберите концентратор, в который нужно развернуть модель. Если у вас нет концентратора, его можно создать.

  7. Укажите имя развертывания и измените другие параметры по умолчанию в зависимости от ваших требований.

  8. Выберите Развернуть.

  9. Вы приземлились на странице сведений о развертывании. Выберите "Открыть на площадке".

  10. Выберите представление кода , чтобы получить примеры кода, которые можно использовать для использования развернутой модели в приложении.

Развертывание модели Azure OpenAI из проекта

Кроме того, можно инициировать развертывание, начиная с проекта в AI Studio.

  1. Перейдите к проекту в AI Studio.
  2. Выберите развертывания компонентов>.
  3. Выберите и создайте развертывание.
  4. В фильтре коллекций выберите Azure OpenAI.
  5. Выберите модель, gpt-4 например из коллекции Azure OpenAI.
  6. Выберите "Подтвердить" , чтобы открыть окно развертывания.
  7. Укажите имя развертывания и измените другие параметры по умолчанию в зависимости от ваших требований.
  8. Выберите Развернуть.
  9. Вы приземлились на странице сведений о развертывании. Выберите "Открыть на площадке".
  10. Выберите представление кода , чтобы получить примеры кода, которые можно использовать для использования развернутой модели в приложении.

Вывод модели Azure OpenAI

Для выполнения вывода в развернутой модели можно использовать игровые площадки или примеры кода. Детская площадка — это веб-интерфейс, позволяющий взаимодействовать с моделью в режиме реального времени. С помощью игровой площадки можно протестировать модель с различными запросами и просмотреть ответы модели.

Дополнительные примеры использования развернутой модели в приложении см. в следующих кратких руководствах по Azure OpenAI:

Ограничения региональной доступности и квоты модели

Стандартная квота для моделей Azure OpenAI зависит от модели и региона. Отдельные модели доступны только в некоторых регионах. Дополнительные сведения об ограничениях доступности и квотах см. в разделе квоты и ограничения службы OpenAI Azure.

Квота для развертывания и вывода модели

Для моделей Azure OpenAI развертывание и вывод использует квоту, назначенную вашей подписке в каждом регионе, на основе модели в единицах токенов в минуту (TPM). При регистрации в Azure AI Studio вы получаете квоту по умолчанию для большинства доступных моделей. Затем вы назначаете доверенному платформенный модуль каждому развертыванию по мере его создания, что позволяет сократить доступную квоту для этой модели на сумму, которую вы назначили. Вы можете продолжать создавать развертывания и назначать их TPM, пока не достигнете предела квоты.

Когда вы достигнете предела квоты, единственным способом создания новых развертываний этой модели является:

  • Запросите дополнительную квоту, отправив форму увеличения квоты.
  • Настройте выделенную квоту для других развертываний моделей, чтобы освободить маркеры для новых развертываний на портале Azure OpenAI.

Дополнительные сведения о квоте см. в статье "Квота Azure AI Studio " и "Управление квотой службы Azure OpenAI".

  • Дополнительные сведения о том, что можно сделать в Azure AI Studio
  • Ответы на часто задаваемые вопросы и ответы по Azure AI