Поделиться через


Развертывание моделей в качестве стандартного развертывания

Из этой статьи вы узнаете, как развернуть модель из каталога моделей в качестве стандартного развертывания.

Некоторые модели в каталоге моделей можно развернуть как обычное развертывание с использованием стандартного тарифа. Такой тип развертывания позволяет использовать модели в качестве API без размещения их в подписке, сохраняя корпоративную безопасность и соответствие требованиям, необходимым организациям. Этот параметр развертывания не требует квоты из подписки.

В этой статье используется модель Meta Llama для иллюстрации. Однако для развертывания любой модели в каталоге моделей, доступных для стандартного развертывания, можно использовать те же действия.

Предварительные условия

  • Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.

  • Рабочая область Машинного обучения Azure.

  • Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роли разработчика ИИ Azure в группе ресурсов. Дополнительные сведения о разрешениях см. в разделе "Управление доступом на основе ролей" в Машинное обучение Azure.

  • Для работы с Машинное обучение Azure необходимо установить следующее программное обеспечение:

    Вы можете использовать любой совместимый веб-браузер для навигации Машинное обучение Azure.

Найдите вашу модель и идентификатор модели в каталоге моделей

  1. Войдите в Студию машинного обучения Azure

  2. Для моделей, предлагаемых через Azure Marketplace, убедитесь, что у вашей учетной записи есть разрешения на роль разработчика ИИ Azure в группе ресурсов или вы соответствуете разрешениям, необходимым для подписки на предложения моделей.

    Счета за модели, предоставляемые поставщиками, не являющихся майкрософт (например, модели Llama и Mistral) выставляются через Azure Marketplace. Для таких моделей необходимо подключить рабочую область к определенной модели. Модели, предлагаемые корпорацией Майкрософт (например, модели Phi-3), не имеют этого требования, так как выставление счетов выполняется по-разному. Дополнительные сведения о выставлении счетов за бессерверное развертывание моделей в каталоге моделей см. в разделе "Выставление счетов для стандартных развертываний".

  3. Перейдите в вашу рабочую область. Чтобы использовать стандартное предложение развертывания, рабочая область должна принадлежать одному из регионов, которые поддерживаются для бессерверного развертывания для конкретной модели, которую вы хотите развернуть.

  4. Выберите каталог моделей на левой боковой панели и найдите карточку модели, которую вы хотите развернуть. В этой статье вы выбираете модель Meta-Llama-3-8B-Instruct .

    1. Если вы развертываете модель с помощью Azure CLI, пакета SDK для Python или ARM, скопируйте идентификатор модели.

    Внимание

    Не включайте версию при копировании идентификатора модели. Стандартные развертывания всегда развертывают самую последнюю доступную версию модели. Например, для идентификатора azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3модели скопируйте azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Снимок экрана: страница сведений о модели.

В следующем разделе рассматриваются шаги по подписке пространства работы на предоставление модели. Этот раздел можно пропустить и перейти к развертыванию модели в стандартном развертывании, если вы развертываете модель Майкрософт.

Подпишите вашу рабочую область на предложение модели.

Стандартные развертывания могут использовать как модели Microsoft, так и модели, предлагаемые другими компаниями. Для моделей Microsoft (например, моделей Phi-3) вам не нужно создавать подписку Azure Marketplace и вы можете развертывать их непосредственно в стандартных развертываниях для использования их прогнозов. Для моделей, отличных от Майкрософт, сначала необходимо создать подписку. Если вы впервые развертываете модель в рабочей области, необходимо подписать рабочую область на конкретное предложение в Azure Marketplace. Каждая рабочая область имеет собственную подписку на модель конкретного предложения в Azure Marketplace, что позволяет управлять и отслеживать расходы.

Примечание.

Модели, предлагаемые в Azure Marketplace, доступны для развертывания в стандартных развертываниях в определенных регионах. Проверьте доступность регионов для моделей в стандартных развертываниях , чтобы проверить, какие модели и регионы доступны. Если нужный вариант не указан, можно развернуть в рабочей области в поддерживаемом регионе, а затем использовать стандартные развертывания из другой рабочей области.

  1. Создайте подписку модели для маркетплейса. При создании подписки вы принимаете условия, связанные с предложением модели. Помните, что вам не нужно выполнять этот шаг для предлагаемых корпорацией Майкрософт моделей (например, Phi-3).

    1. На странице сведений о модели выберите "Развернуть". Откроется окно параметров развертывания , предоставляющее выбор между стандартным развертыванием и развертыванием с помощью управляемых вычислений.

      Примечание.

      Для моделей, которые можно развернуть только через стандартное развертывание, мастер стандартного развертывания открывается сразу после выбора " Развернуть " на странице сведений о модели.

    2. Выберите стандартное развертывание с помощью azure AI Content Safety (предварительная версия), чтобы открыть мастер стандартного развертывания.

    3. Установите флажок, чтобы подтвердить политику покупки Майкрософт.

      Снимок экрана: развертывание модели с помощью стандартного варианта развертывания.

    4. Если вы видите заметку , у вас уже есть подписка Azure Marketplace для этой рабочей области, вам не нужно создавать подписку, так как у вас уже есть подписка. Вы можете перейти к развертыванию модели в стандартном развертывании.

    5. В мастере развертывания выберите ссылку на условия использования Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку "Цены и условия ", чтобы узнать о ценах для выбранной модели.

    6. В мастере развертывания выберите ссылку на условия использования Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку сведений о предложении Marketplace, чтобы узнать о ценах на выбранную модель.

    7. Выберите "Подписаться" и " Развернуть".

  2. Подписавшись на рабочую область для конкретного предложения Azure Marketplace, последующие развертывания одного и того же предложения в той же рабочей области не требуют повторной подписки.

  3. В любой момент вы можете увидеть модельные предложения, которыми в настоящий момент пользуется ваша рабочая область.

    1. Перейдите на портал Azure.

    2. Перейдите в группу ресурсов, где находится рабочая область.

    3. В фильтре типов выберите SaaS.

    4. Вы увидите все предложения, на которые вы подписаны в настоящее время.

    5. Выберите любой ресурс, чтобы просмотреть сведения.

Развертывание модели в стандартную конфигурацию

После создания подписки для модели, отличной от Майкрософт, можно развернуть связанную модель в стандартном развертывании. Для моделей Майкрософт (например, моделей Phi-3) вам не нужно создавать подписку.

Стандартное развертывание обеспечивает возможность использования моделей в качестве API без необходимости их размещения на вашей подписке, при этом обеспечивая предприятиям безопасность и соответствие требованиям организаций. Этот параметр развертывания не требует квоты из подписки.

В этом разделе описано, как создать конечную точку с именем meta-llama3-8b-qwerty.

  1. Создание бессерверной конечной точки

    1. Чтобы развернуть модель Майкрософт, которая не требует подписки на предложение модели, выберите Развернуть, а затем выберите стандартное развертывание с помощью Azure AI Content Safety (предварительная версия), чтобы открыть мастер развертывания.

    2. Кроме того, для немайкрософтовской модели, требующей подписки, если вы только что подписали вашу рабочую область на предложение модели в предыдущем разделе, продолжайте и выберите "Развернуть". Кроме того, выберите "Продолжить развертывание" (если в мастере развертывания есть отметка У вас уже есть подписка на Azure Marketplace для этой рабочей области).

      Скриншот показывает рабочую область, которая уже подписана на предложение.

    3. Присвойте развертыванию имя. Это имя становится частью URL-адреса API развертывания. Этот URL-адрес должен быть уникальным в каждом регионе Azure.

      Снимок экрана, показывающий, как указать имя создаваемого развертывания.

      Совет

      Параметр фильтра содержимого (предварительная версия) включен по умолчанию. Оставьте параметр по умолчанию для службы, чтобы обнаружить вредное содержимое, например ненависть, самоповредение, сексуальное и насильственное содержимое. Дополнительные сведения о фильтрации содержимого (предварительная версия) см. в разделе "Безопасность содержимого" для моделей, развернутых с помощью стандартных развертываний.

    4. Выберите Развернуть. Подождите, пока развертывание будет готово, и вы будете перенаправлены на страницу "Развертывания".

  2. В любой момент можно увидеть конечные точки, развернутые в рабочей области:

    1. Перейдите в вашу рабочую область.

    2. Выберите Конечные точки.

    3. Перейдите на вкладку "Бессерверные конечные точки" , чтобы отобразить стандартные развертывания.

  3. Созданная конечная точка использует проверку подлинности ключа для авторизации. Чтобы получить ключи, связанные с данной конечной точкой, выполните следующие действия.

    1. Чтобы вернуться на страницу развертывания, выберите имя конечной точки из списка бессерверных конечных точек.
    2. Обратите внимание на URI целевой конечной точки и ключ. Используйте их для вызова развертывания и создания прогнозов.

    Примечание.

    При использовании портала Azure стандартные развертывания по умолчанию не отображаются в группе ресурсов. Используйте параметр "Показать скрытые типы", чтобы отобразить их в группе ресурсов.

  4. На этом этапе ваша конечная точка готова к использованию.

  5. Если вам нужно использовать это развертывание из другой рабочей области или вы планируете использовать поток запросов для создания интеллектуальных приложений, необходимо создать подключение к стандартному развертыванию. Сведения о том, как настроить существующее стандартное развертывание в новой рабочей области или концентраторе, см. в статье Потребление развернутых стандартных развертываний из другой рабочей области или потока Prompt.

    Совет

    Если вы используете поток команд в той же рабочей области, где было произведено развертывание, все равно необходимо создать подключение.

Используйте стандартное развертывание

Модели, развернутые в Машинном обучении Azure и Azure AI Foundry в стандартных развертываниях, поддерживают API вывода моделей Azure, которые предоставляют общий набор возможностей для базовых моделей и которые могут использоваться разработчиками для использования прогнозов из различных наборов моделей в едином и согласованном режиме.

Узнайте больше о возможностях этого API и о том, как его использовать при создании приложений.

Удаление конечных точек и подписок

Вы можете удалить подписки и конечные точки модели. Удаление подписки модели делает любую связанную конечную точку неработоспособной и непригодной для использования.

Чтобы удалить стандартное развертывание, выполните приведенные действия.

  1. Перейдите к Студия машинного обучения Azure.

  2. Выберите конечные точки на левой боковой панели.

  3. Перейдите на вкладку "Бессерверные конечные точки" , чтобы отобразить стандартные развертывания.

  4. Откройте конечную точку, которую нужно удалить.

  5. Выберите команду Удалить.

Чтобы удалить связанную подписку модели, выполните следующие действия.

  1. Перейдите на портал Azure.

  2. Перейдите в группу ресурсов, где находится рабочая область.

  3. В фильтре типов выберите SaaS.

  4. Выберите подписку, которую нужно удалить.

  5. Выберите команду Удалить.

Рекомендации по затратам и квотам для моделей, развернутых в качестве стандартных развертываний

Квота изменяется для каждого развертывания. Каждое развертывание имеет ограничение трафика в 200 000 токенов в минуту и 1000 запросов API в минуту. Однако в настоящее время мы ограничиваем одно развертывание на одну модель для одного рабочего пространства. Обратитесь в службу поддержки Microsoft Azure, если текущие ограничения трафика недостаточны для ваших сценариев.

Стоимость моделей Майкрософт

Вы можете найти сведения о ценах на вкладке "Цены и условия " мастера развертывания при развертывании моделей Майкрософт (например, моделей Phi-3) в качестве стандартных развертываний.

Стоимость моделей, отличных от Майкрософт

Немайкрософт модели, развернутые как стандартные, предлагаются через Azure Marketplace и интегрированы с Azure AI Foundry для использования. Цены на Azure Marketplace можно найти при развертывании или настройке этих моделей.

Каждый раз, когда рабочая область подписывается на определенное предложение из Azure Marketplace, создается новый ресурс, чтобы отслеживать затраты, связанные с его использованием. Тот же ресурс используется для отслеживания затрат, связанных с выводом и настройкой; однако для отслеживания каждого сценария по отдельности можно использовать несколько счетчиков.

Дополнительные сведения о том, как отслеживать затраты, см. в статье Мониторинг затрат для моделей, предлагаемых в Azure Marketplace.

Снимок экрана: различные ресурсы, соответствующие различным предложениям модели и связанным с ними счетчикам.

Разрешения, необходимые для подписки на предложения моделей

Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роль владельца, участника или разработчика ИИ Azure для подписки Azure. Кроме того, вашей учетной записи может быть назначена настраиваемая роль, которая имеет следующие разрешения:

  • В подписке Azure — чтобы подписаться на рабочую область на предложение Azure Marketplace один раз для каждой рабочей области для каждого предложения:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Для создания и использования ресурса SaaS в группе ресурсов выполните следующие действия:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • В рабочей области — для развертывания конечных точек (роль специалиста по обработке и анализу данных машинного обучения Azure уже содержит эти разрешения):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Дополнительные сведения о разрешениях см. в статье Управление доступом к рабочей области Машинного обучения Azure.