Поделиться через


Развертывание моделей в качестве конечных точек API без сервера

В этой статье вы узнаете, как развернуть модель из каталога моделей в качестве бессерверного API с выставлением счетов по мере использования маркеров.

Некоторые модели в каталоге моделей можно развернуть как бессерверный API с выставлением счетов по мере использования. Такой тип развертывания позволяет использовать модели в качестве API без размещения их в подписке, сохраняя корпоративную безопасность и соответствие требованиям, необходимым организациям. Этот параметр развертывания не требует квоты из подписки.

В этой статье используется развертывание модели Meta Llama для иллюстрации. Однако для развертывания любой модели в каталоге моделей, доступных для развертывания бессерверного API, можно использовать те же действия.

Необходимые компоненты

  • Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.

  • Рабочая область Машинного обучения Azure.

  • Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роли разработчика ИИ Azure в группе ресурсов. Дополнительные сведения о разрешениях см. в разделе "Управление доступом на основе ролей" в Машинное обучение Azure.

  • Для работы с Машинное обучение Azure необходимо установить следующее программное обеспечение:

    Вы можете использовать любой совместимый веб-браузер для навигации Машинное обучение Azure.

Поиск модели и идентификатора модели в каталоге моделей

  1. Войдите в Студию машинного обучения Azure

  2. Для моделей, предлагаемых через Azure Marketplace, убедитесь, что у вашей учетной записи есть разрешения на роль разработчика ИИ Azure в группе ресурсов или вы соответствуете разрешениям, необходимым для подписки на предложения моделей.

    Счета за модели, предоставляемые поставщиками, не являющихся майкрософт (например, модели Llama и Mistral) выставляются через Azure Marketplace. Для таких моделей необходимо подписать рабочую область на конкретное предложение модели. Модели, предлагаемые корпорацией Майкрософт (например, модели Phi-3), не имеют этого требования, так как выставление счетов выполняется по-разному. Дополнительные сведения о выставлении счетов за бессерверное развертывание моделей в каталоге моделей см. в разделе "Выставление счетов для бессерверных API".

  3. Перейдите в рабочую область. Чтобы использовать предложение развертывания модели API без сервера, рабочая область должна принадлежать одному из регионов, которые поддерживаются для бессерверного развертывания для конкретной модели, которую требуется развернуть.

  4. Выберите каталог моделей на левой боковой панели и найдите карточку модели, которую вы хотите развернуть. В этой статье вы выбираете модель Meta-Llama-3-8B-Instruct .

    1. Если вы развертываете модель с помощью Azure CLI, пакета SDK для Python или ARM, скопируйте идентификатор модели.

    Внимание

    Не включайте версию при копировании идентификатора модели. Конечные точки API без сервера всегда развертывают последнюю версию модели. Например, для идентификатора azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3модели скопируйте azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Снимок экрана: страница сведений о модели.

В следующем разделе рассматриваются действия по подписке рабочей области на предложение модели. Этот раздел можно пропустить и перейти к развертыванию модели в конечной точке бессерверного API, если вы развертываете модель Майкрософт.

Подписка рабочей области на предложение модели

Конечные точки API без сервера могут развертывать как предлагаемые корпорацией Майкрософт, так и не майкрософт модели. Для моделей Майкрософт (таких как модели Phi-3) вам не нужно создавать подписку Azure Marketplace и развертывать их в бессерверных конечных точках API непосредственно для использования прогнозов. Для моделей, отличных от Майкрософт, сначала необходимо создать подписку. Если вы впервые развертываете модель в рабочей области, необходимо подписать рабочую область для конкретной модели из Azure Marketplace. Каждая рабочая область имеет собственную подписку на конкретное предложение Azure Marketplace модели, что позволяет контролировать расходы и отслеживать расходы.

Примечание.

Модели, предлагаемые в Azure Marketplace, доступны для развертывания в конечных точках API без сервера в определенных регионах. Проверьте доступность регионов для моделей в конечных точках API без сервера, чтобы проверить, какие модели и регионы доступны. Если нужный объект не указан, можно развернуть в рабочей области в поддерживаемом регионе, а затем использовать конечные точки API без сервера из другой рабочей области.

  1. Создайте подписку Marketplace модели. При создании подписки вы принимаете условия, связанные с предложением модели. Помните, что вам не нужно выполнять этот шаг для предлагаемых корпорацией Майкрософт моделей (например, Phi-3).

    1. На странице сведений о модели выберите "Развернуть". Откроется окно параметров развертывания, предоставляющее выбор между бессерверным развертыванием API и развертыванием с помощью управляемых вычислений.

      Примечание.

      Для моделей, которые можно развернуть только с помощью бессерверного развертывания API, мастер развертывания бессерверных API открывается сразу после выбора " Развернуть " на странице сведений о модели.

    2. Выберите бессерверный API с помощью azure AI Content Safety (предварительная версия), чтобы открыть мастер развертывания бессерверных API.

    3. Установите флажок, чтобы подтвердить политику покупки Майкрософт.

      Снимок экрана: развертывание модели с параметром бессерверного API.

    4. Если вы видите заметку , у вас уже есть подписка Azure Marketplace для этой рабочей области, вам не нужно создавать подписку, так как у вас уже есть подписка. Вы можете перейти к развертыванию модели в конечной точке бессерверного API.

    5. В мастере развертывания выберите ссылку на условия использования Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку "Цены и условия ", чтобы узнать о ценах для выбранной модели.

    6. В мастере развертывания выберите ссылку на условия использования Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку сведений о предложении Marketplace, чтобы узнать о ценах на выбранную модель.

    7. Выберите "Подписаться" и " Развернуть".

  2. Подписавшись на рабочую область для конкретного предложения Azure Marketplace, последующие развертывания одного и того же предложения в той же рабочей области не требуют повторной подписки.

  3. В любой момент вы можете просмотреть предложения модели, на которые в настоящее время подписана ваша рабочая область:

    1. Перейдите на портал Azure.

    2. Перейдите в группу ресурсов, в которой принадлежит рабочая область.

    3. В фильтре типов выберите SaaS.

    4. Вы увидите все предложения, на которые вы подписаны в настоящее время.

    5. Выберите любой ресурс, чтобы просмотреть сведения.

Развертывание модели в конечной точке бессерверного API

После создания подписки для модели, отличной от Майкрософт, можно развернуть связанную модель в конечной точке бессерверного API. Для моделей Майкрософт (например, моделей Phi-3) вам не нужно создавать подписку.

Конечная точка БЕССерверного API предоставляет способ использования моделей в качестве API без размещения их в подписке, при этом организации безопасности и соответствия требованиям предприятия требуются. Этот параметр развертывания не требует квоты из подписки.

В этом разделе описано, как создать конечную точку с именем meta-llama3-8b-qwerty.

  1. Создание бессерверной конечной точки

    1. Чтобы развернуть модель Майкрософт, которая не требует подписки на предложение модели, выберите "Развернуть", а затем выберите бессерверный API с помощью azure AI Content Safety (предварительная версия), чтобы открыть мастер развертывания.

    2. Кроме того, для модели, отличной от Майкрософт, требующей подписки на модель, если вы только что подписали свою рабочую область на предложение модели в предыдущем разделе, перейдите к выбору "Развернуть". Кроме того, выберите "Продолжить развертывание " (если в мастере развертывания уже есть подписка Azure Marketplace для этой рабочей области).

      Снимок экрана: рабочая область, которая уже подписана на предложение.

    3. Присвойте развертыванию имя. Это имя становится частью URL-адреса API развертывания. Этот URL-адрес должен быть уникальным в каждом регионе Azure.

      Снимок экрана, показывающий, как указать имя создаваемого развертывания.

      Совет

      Параметр фильтра содержимого (предварительная версия) включен по умолчанию. Оставьте параметр по умолчанию для службы, чтобы обнаружить вредное содержимое, например ненависть, самоповредение, сексуальное и насильственное содержимое. Дополнительные сведения о фильтрации содержимого см. в разделе "Безопасность содержимого" для моделей, развернутых с помощью бессерверных API.

    4. Выберите Развернуть. Подождите, пока развертывание будет готово, и вы будете перенаправлены на страницу "Развертывания".

  2. В любой момент можно увидеть конечные точки, развернутые в рабочей области:

    1. Перейдите в рабочую область.

    2. Выберите Конечные точки.

    3. Перейдите на вкладку "Бессерверные конечные точки", чтобы отобразить конечные точки API без сервера.

  3. Созданная конечная точка использует проверку подлинности ключа для авторизации. Чтобы получить ключи, связанные с данной конечной точкой, выполните следующие действия.

    1. Чтобы вернуться на страницу развертывания, выберите имя конечной точки из списка бессерверных конечных точек.
    2. Обратите внимание на URI целевой конечной точки и ключ. Используйте их для вызова развертывания и создания прогнозов.

    Примечание.

    При использовании портал Azure конечные точки API без сервера не отображаются по умолчанию в группе ресурсов. Используйте параметр "Показать скрытые типы", чтобы отобразить их в группе ресурсов.

  4. На этом этапе ваша конечная точка готова к использованию.

  5. Если необходимо использовать это развертывание из другой рабочей области или вы планируете использовать поток запросов для создания интеллектуальных приложений, необходимо создать подключение к развертыванию бессерверного API. Сведения о настройке существующей конечной точки API без сервера в новой рабочей области или концентраторе см. в статье "Использование развернутых конечных точек БЕССерверного API из другой рабочей области или потока запроса".

    Совет

    Если вы используете поток запросов в той же рабочей области, где развернуто развертывание, необходимо создать подключение.

Использование конечной точки API без сервера

Модели, развернутые в Машинное обучение Azure и Студии ИИ Azure в конечных точках БЕССерверных API, поддерживают API вывода модели ИИ Azure, предоставляющий общий набор возможностей для базовых моделей и которые могут использоваться разработчиками для использования прогнозов из различных наборов моделей в единообразном и согласованном режиме.

Узнайте больше о возможностях этого API и о том, как его использовать при создании приложений.

Удаление конечных точек и подписок

Вы можете удалить подписки и конечные точки модели. Удаление подписки модели делает любую связанную конечную точку неработоспособным и непригодным для использования.

Чтобы удалить конечную точку API без сервера, выполните следующие действия.

  1. Перейдите к Студия машинного обучения Azure.

  2. Выберите конечные точки на левой боковой панели.

  3. Перейдите на вкладку "Бессерверные конечные точки", чтобы отобразить конечные точки API без сервера.

  4. Откройте конечную точку, которую нужно удалить.

  5. Выберите команду Удалить.

Чтобы удалить связанную подписку модели, выполните следующие действия.

  1. Перейдите на портал Azure.

  2. Перейдите в группу ресурсов, в которой принадлежит рабочая область.

  3. В фильтре типов выберите SaaS.

  4. Выберите подписку, которую нужно удалить.

  5. Выберите команду Удалить.

Рекомендации по затратам и квотам для моделей, развернутых в качестве конечных точек API без сервера

Квота изменяется для каждого развертывания. Каждое развертывание имеет ограничение трафика в 200 000 токенов в минуту и 1000 запросов API в минуту. Однако в настоящее время мы ограничиваем одно развертывание на одну модель для одного рабочего пространства. Обратитесь в службу поддержки Microsoft Azure, если текущие ограничения трафика недостаточны для ваших сценариев.

Стоимость моделей Майкрософт

Вы можете найти сведения о ценах на вкладке "Цены и условия " мастера развертывания при развертывании моделей Майкрософт (например, моделей Phi-3) в качестве конечных точек бессерверных API.

Стоимость моделей, отличных от Майкрософт

Модели, не являющиеся Майкрософт, развернутые в качестве бессерверных конечных точек API, предлагаются через Azure Marketplace и интегрированы с Azure AI Studio для использования. Цены на Azure Marketplace можно найти при развертывании или настройке этих моделей.

Каждый раз, когда рабочая область подписывается на данное предложение из Azure Marketplace, создается новый ресурс для отслеживания затрат, связанных с его потреблением. Тот же ресурс используется для отслеживания затрат, связанных с выводом и настройкой; однако для отслеживания каждого сценария по отдельности можно использовать несколько счетчиков.

Дополнительные сведения о том, как отслеживать затраты, см. в статье Мониторинг затрат для моделей, предлагаемых в Azure Marketplace.

Снимок экрана: различные ресурсы, соответствующие различным предложениям модели и связанным с ними счетчикам.

Разрешения, необходимые для подписки на предложения моделей

Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роль владельца, участника или разработчика ИИ Azure для подписки Azure. Кроме того, вашей учетной записи может быть назначена настраиваемая роль, которая имеет следующие разрешения:

  • В подписке Azure — чтобы подписаться на рабочую область на предложение Azure Marketplace один раз для каждой рабочей области для каждого предложения:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Для создания и использования ресурса SaaS в группе ресурсов выполните следующие действия:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • В рабочей области — для развертывания конечных точек (роль специалиста по обработке и анализу данных машинного обучения Azure уже содержит эти разрешения):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Дополнительные сведения о разрешениях см. в статье Управление доступом к рабочей области Машинного обучения Azure.