Поделиться через


Переход на Обслуживание моделей

В этой статье показано, как включить обслуживание моделей в рабочей области и переключить модели на новый интерфейс обслуживания моделей, построенный на бессерверных вычислениях.

Требования

Значительные изменения

  • В службе "Модель" формат запроса к конечной точке и ответ от конечной точки немного отличается от устаревшей модели MLflow. Дополнительные сведения о новом протоколе форматирования см. в статье об оценке конечной точки модели.
  • В службе "Служба моделей" URL-адрес конечной точки включается serving-endpoints вместо model.
  • Служба моделей включает полную поддержку управления ресурсами с помощью рабочих процессов API.
  • Служба моделей готова к работе и поддерживается соглашением об уровне обслуживания Azure Databricks.

Перенос устаревших моделей MLflow Service в модель обслуживания моделей

Вы можете создать конечную точку обслуживания моделей и гибко перейти к рабочим процессам, не отключая устаревшую модель MLflow.

Далее показано, как это сделать с помощью пользовательского интерфейса. Для каждой модели, в которой включена устаревшая модель MLflow:

  1. Перейдите к конечным точкам обслуживания на боковой панели рабочей области машинного обучения.
  2. Выполните рабочий процесс, описанный в статье "Создание пользовательских конечных точек обслуживания модели", чтобы создать конечную точку обслуживания с помощью модели.
  3. Переведите приложение для использования нового URL-адреса, предоставленного конечной точкой обслуживания, для запроса модели вместе с новым форматом оценки.
  4. При переходе на модели можно перейти к моделям на боковой панели рабочей области машинного обучения.
  5. Выберите модель, для которой требуется отключить устаревшую модель MLflow.
  6. На вкладке Обслуживание выберите Остановить.
  7. Появится сообщение для подтверждения. Выберите Остановить обслуживание.

Перенос развернутых версий модели в модель обслуживания

В предыдущих версиях функциональных возможностей службы модели конечная точка обслуживания была создана на основе этапа зарегистрированной версии модели: Staging или Production. Чтобы перенести обслуживаемые модели из этого интерфейса, вы можете реплицировать это поведение в новом интерфейсе обслуживания моделей.

В этом разделе показано, как создать отдельные конечные точки обслуживания моделей для Staging версий моделей и Production версий модели. Ниже показано, как это сделать с помощью API конечных точек обслуживания для каждой из обслуживаемых моделей.

В примере имя modelA зарегистрированной модели имеет версию 1 на этапе Production модели и версии 2 на этапе Stagingмодели.

  1. Создайте две конечные точки для зарегистрированной модели, одну для Staging версий модели и другую для Production версий модели.

    Для Staging версий модели:

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Staging"
         "config":{
            "served_entities":[
               {
                  "entity_name":"model-A",
                  "entity_version":"2",  // Staging Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    

    Для Production версий модели:

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Production"
         "config":{
            "served_entities":[
               {
                  "entity_name":"model-A",
                  "entity_version":"1",   // Production Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    
  2. Проверьте состояние конечных точек.

    Для промежуточной конечной точки: GET /api/2.0/serving-endpoints/modelA-Staging

    Для рабочей конечной точки: GET /api/2.0/serving-endpoints/modelA-Production

  3. После готовности конечных точек запросите конечную точку с помощью:

    Для промежуточной конечной точки: POST /serving-endpoints/modelA-Staging/invocations

    Для рабочей конечной точки: POST /serving-endpoints/modelA-Production/invocations

  4. Обновите конечную точку на основе переходов версий модели.

    В сценарии, в котором создается новая модель 3, можно перейти Productionна модель версии 2, а модель 3 может перейти на Staging модель 1 и модель версии 1 Archived. Эти изменения можно отразить в отдельных конечных точках обслуживания модели следующим образом:

    Для конечной Staging точки обновите конечную точку, чтобы использовать новую версию модели в Staging.

    PUT /api/2.0/serving-endpoints/modelA-Staging/config
    {
       "served_entities":[
          {
             "entity_name":"model-A",
             "entity_version":"3",  // New Staging model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

    Для Production конечной точки обновите конечную точку, чтобы использовать новую версию модели в Production.

    PUT /api/2.0/serving-endpoints/modelA-Production/config
    {
       "served_entities":[
          {
             "entity_name":"model-A",
             "entity_version":"2",  // New Production model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

Перенос рабочих процессов вывода MosaicML в модель обслуживания

В этом разделе содержатся инструкции по переносу развертываний вывода MosaicML в Службу моделей ИИ Мозаики и включают пример записной книжки.

В следующей таблице приводится сводка по четности между выводом MosaicML и моделью, обслуживаемой в Azure Databricks.

Вывод MosaicML Мозаичная модель ИИ
create_inference_deployment Создание конечной точки обслуживания модели
update_inference_deployment Обновление конечной точки обслуживания модели
delete_inference_deployment Удаление конечной точки обслуживания модели
get_inference_deployment Получение состояния конечной точки обслуживания модели

В следующей записной книжке приведен пример миграции llama-13b модели из MosaicML в Службу модели ИИ Мозаики.

Переход с вывода Из MosaicML в записную книжку для обслуживания моделей ИИ Для Мозаики

Получить записную книжку

Дополнительные ресурсы