Поделиться через


Рабочие области Microsoft.MachineLearningServices/onlineEndpoints/deployments 2024-07-01-preview

Определение ресурсов Bicep

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий Bicep в шаблон.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Для управляемыхиспользуйте:

  endpointComputeType: 'Managed'

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

  scaleType: 'Default'

Для TargetUtilizationиспользуйте:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Значения свойств

workspaces/onlineEndpoints/deployments

Имя Описание Ценность
имя Имя ресурса

Узнайте, как задать имена и типы дочерних ресурсов в Bicep.
строка (обязательно)
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
Теги Теги ресурсов. Словарь имен и значений тегов. См. теги в шаблонах
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. Sku
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
родитель В Bicep можно указать родительский ресурс для дочернего ресурса. Это свойство необходимо добавить, только если дочерний ресурс объявлен за пределами родительского ресурса.

Дополнительные сведения см. в разделе Дочерний ресурс за пределами родительского ресурса.
Символьное имя ресурса типа: onlineEndpoints
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). "Нет"
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
userAssignedIdentities Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. UserAssignedIdentities

UserAssignedIdentities

Имя Описание Ценность
{настраиваемое свойство} UserAssignedIdentity

UserAssignedIdentity

Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
dataCollector Конфигурация mdc отключается при значении NULL. DataCollector
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Установка типа объекта Kubernetes
Управляемое (обязательно)

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" строка (обязательно)

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Имя Описание Ценность
Коллекции [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой.
Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала.
DataCollectorCollections (обязательно)
requestLogging Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. RequestLogging
скользящей скорости При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов.
Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/.
Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/.
Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.
"День"
"Час"
"Минута"
"Месяц"
"Год"

DataCollectorCollections

Имя Описание Ценность
{настраиваемое свойство} коллекции

Коллекция

Имя Описание Ценность
clientId Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. струна
dataCollectionMode Включение или отключение сбора данных. "Отключено"
"Включено"
dataId Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. струна
выборка Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. int

RequestLogging

Имя Описание Ценность
captureHeaders Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность
{настраиваемое свойство} струна

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность
{настраиваемое свойство} струна

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установка типа объекта по умолчанию
TargetUtilization (обязательно)

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания Default (обязательно)

TargetUtilizationScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

KubernetesOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Managed (обязательный)

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"

Определение ресурса шаблона ARM

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий код JSON в шаблон.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2024-07-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Для управляемыхиспользуйте:

  "endpointComputeType": "Managed"

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

  "scaleType": "Default"

Для TargetUtilizationиспользуйте:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Значения свойств

workspaces/onlineEndpoints/deployments

Имя Описание Ценность
тип Тип ресурса "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Версия API ресурсов '2024-07-01-preview'
имя Имя ресурса

Узнайте, как задать имена и типы дочерних ресурсов в шаблонах ARM JSON.
строка (обязательно)
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
Теги Теги ресурсов. Словарь имен и значений тегов. См. теги в шаблонах
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. Sku
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). "Нет"
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
userAssignedIdentities Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. UserAssignedIdentities

UserAssignedIdentities

Имя Описание Ценность
{настраиваемое свойство} UserAssignedIdentity

UserAssignedIdentity

Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
dataCollector Конфигурация mdc отключается при значении NULL. DataCollector
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Установка типа объекта Kubernetes
Управляемое (обязательно)

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" строка (обязательно)

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Имя Описание Ценность
Коллекции [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой.
Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала.
DataCollectorCollections (обязательно)
requestLogging Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. RequestLogging
скользящей скорости При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов.
Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/.
Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/.
Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.
"День"
"Час"
"Минута"
"Месяц"
"Год"

DataCollectorCollections

Имя Описание Ценность
{настраиваемое свойство} коллекции

Коллекция

Имя Описание Ценность
clientId Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. струна
dataCollectionMode Включение или отключение сбора данных. "Отключено"
"Включено"
dataId Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. струна
выборка Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. int

RequestLogging

Имя Описание Ценность
captureHeaders Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность
{настраиваемое свойство} струна

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность
{настраиваемое свойство} струна

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установка типа объекта по умолчанию
TargetUtilization (обязательно)

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания Default (обязательно)

TargetUtilizationScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

KubernetesOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Managed (обязательный)

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"

Определение ресурса Terraform (поставщик AzAPI)

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

  • групп ресурсов

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий объект Terraform в шаблон.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Для управляемыхиспользуйте:

  endpointComputeType = "Managed"

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

  scaleType = "Default"

Для TargetUtilizationиспользуйте:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Значения свойств

workspaces/onlineEndpoints/deployments

Имя Описание Ценность
тип Тип ресурса "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview"
имя Имя ресурса строка (обязательно)
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
parent_id Идентификатор ресурса, который является родительским для этого ресурса. Идентификатор ресурса типа: onlineEndpoints
Теги Теги ресурсов. Словарь имен и значений тегов.
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. Sku
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
identity_ids Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. Массив идентификаторов удостоверений пользователя.

UserAssignedIdentities

Имя Описание Ценность
{настраиваемое свойство} UserAssignedIdentity

UserAssignedIdentity

Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
dataCollector Конфигурация mdc отключается при значении NULL. DataCollector
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Установка типа объекта Kubernetes
Управляемое (обязательно)

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" строка (обязательно)

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Имя Описание Ценность
Коллекции [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой.
Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала.
DataCollectorCollections (обязательно)
requestLogging Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. RequestLogging
скользящей скорости При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов.
Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/.
Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/.
Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.
"День"
"Час"
"Minute"
"Месяц"
"Год"

DataCollectorCollections

Имя Описание Ценность
{настраиваемое свойство} коллекции

Коллекция

Имя Описание Ценность
clientId Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. струна
dataCollectionMode Включение или отключение сбора данных. "Отключено"
"Включено"
dataId Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. струна
выборка Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. int

RequestLogging

Имя Описание Ценность
captureHeaders Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность
{настраиваемое свойство} струна

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность
{настраиваемое свойство} струна

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установка типа объекта по умолчанию
TargetUtilization (обязательно)

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания "Default" (обязательно)

TargetUtilizationScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

KubernetesOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. "Managed" (обязательно)

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"