Рабочие области Microsoft.MachineLearningServices/onlineEndpoints/deployments 2024-07-01-preview
Определение ресурсов Bicep
Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:
- группы ресурсов . См. команды развертывания группы ресурсов
Список измененных свойств в каждой версии API см. в журнала изменений.
Формат ресурса
Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий Bicep в шаблон.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Объекты OnlineDeploymentProperties
Задайте свойство endpointComputeType, чтобы указать тип объекта.
Для Kubernetesиспользуйте:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Для управляемых
endpointComputeType: 'Managed'
Объекты OnlineScaleSettings
Задайте свойство scaleType, чтобы указать тип объекта.
Для по умолчаниюиспользуйте:
scaleType: 'Default'
Для TargetUtilizationиспользуйте:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Значения свойств
workspaces/onlineEndpoints/deployments
Имя | Описание | Ценность |
---|---|---|
имя | Имя ресурса Узнайте, как задать имена и типы дочерних ресурсов в Bicep. |
строка (обязательно) |
местоположение | Географическое расположение, в котором находится ресурс | строка (обязательно) |
Теги | Теги ресурсов. | Словарь имен и значений тегов. См. теги в шаблонах |
SKU | Сведения о SKU, необходимые для контракта ARM для автомасштабирования. | Sku |
добрый | Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. | струна |
родитель | В Bicep можно указать родительский ресурс для дочернего ресурса. Это свойство необходимо добавить, только если дочерний ресурс объявлен за пределами родительского ресурса. Дополнительные сведения см. в разделе Дочерний ресурс за пределами родительского ресурса. |
Символьное имя ресурса типа: onlineEndpoints |
тождество | Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения | ManagedServiceIdentity |
свойства | [Обязательный] Дополнительные атрибуты сущности. | OnlineDeploymentProperties (обязательно) |
ManagedServiceIdentity
Имя | Описание | Ценность |
---|---|---|
тип | Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). | "Нет" SystemAssigned SystemAssigned, UserAssigned UserAssigned (обязательно) |
userAssignedIdentities | Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. | UserAssignedIdentities |
UserAssignedIdentities
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | UserAssignedIdentity |
UserAssignedIdentity
Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.
OnlineDeploymentProperties
Имя | Описание | Ценность |
---|---|---|
appInsightsEnabled | Если значение true, включает ведение журнала Application Insights. | bool |
codeConfiguration | Конфигурация кода для развертывания конечной точки. | CodeConfiguration |
dataCollector | Конфигурация mdc отключается при значении NULL. | DataCollector |
описание | Описание развертывания конечной точки. | струна |
исходящий трафикPublicNetworkAccess | Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. | "Отключено" "Включено" |
environmentId | Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. | струна |
environmentVariables | Конфигурация переменных среды для развертывания. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Тип вычислительного экземпляра. | струна |
livenessProbe | Проба динамической активности регулярно отслеживает работоспособность контейнера. | ProbeSettings |
модель | Путь URI к модели. | струна |
modelMountPath | Путь к подключению модели в пользовательском контейнере. | струна |
свойства | Словарь свойств. Свойства можно добавлять, но не удалять или изменять. | EndpointDeploymentPropertiesBaseProperties |
готовностьProbe | Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. | ProbeSettings |
requestSettings | Параметры запроса для развертывания. | OnlineRequestSettings |
scaleSettings | Параметры масштабирования развертывания. Если значение равно null или не указано, По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и значение DefaultScaleSettings для ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Установка типа объекта |
Kubernetes Управляемое (обязательно) |
CodeConfiguration
Имя | Описание | Ценность |
---|---|---|
codeId | Идентификатор ресурса ARM ресурса ресурса кода. | струна |
оценкаScript | [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" | строка (обязательно) Ограничения целостности: Минимальная длина = 1 Pattern = [a-zA-Z0-9_] |
DataCollector
Имя | Описание | Ценность |
---|---|---|
Коллекции | [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой. Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала. |
DataCollectorCollections (обязательно) |
requestLogging | Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. | RequestLogging |
скользящей скорости | При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных. |
"День" "Час" "Минута" "Месяц" "Год" |
DataCollectorCollections
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | коллекции |
Коллекция
Имя | Описание | Ценность |
---|---|---|
clientId | Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. | струна |
dataCollectionMode | Включение или отключение сбора данных. | "Отключено" "Включено" |
dataId | Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. | струна |
выборка | Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. | int |
RequestLogging
Имя | Описание | Ценность |
---|---|---|
captureHeaders | Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
ПробыSettings
Имя | Описание | Ценность |
---|---|---|
failureThreshold | Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. | int |
initialDelay | Задержка перед первой пробой в формате ISO 8601. | струна |
период | Продолжительность времени между пробами в формате ISO 8601. | струна |
successThreshold | Количество успешных проб перед возвратом работоспособного состояния. | int |
Времени ожидания | Время ожидания пробы в формате ISO 8601. | струна |
EndpointDeploymentPropertiesBaseProperties
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
OnlineRequestSettings
Имя | Описание | Ценность |
---|---|---|
maxConcurrentRequestsPerInstance | Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. | int |
maxQueueWait | (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601. Значение по умолчанию — 500 мс. (Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей) |
струна |
requestTimeout | Время ожидания оценки в формате ISO 8601. Значение по умолчанию — 5000 мс. |
струна |
OnlineScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | Установка типа объекта |
по умолчанию TargetUtilization (обязательно) |
DefaultScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | Default (обязательно) |
TargetUtilizationScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | TargetUtilization (обязательный) |
maxInstances | Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. | int |
minInstances | Минимальное количество экземпляров, которые всегда должны присутствовать. | int |
pollingInterval | Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. | струна |
targetUtilizationPercentage | Целевое использование ЦП для автомасштабирования. | int |
KubernetesOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | Kubernetes (обязательно) |
containerResourceRequirements | Требования к ресурсам для контейнера (ЦП и памяти). | ContainerResourceRequirements |
ContainerResourceRequirements
Имя | Описание | Ценность |
---|---|---|
containerResourceLimits | Сведения об ограничении ресурсов контейнера: | ContainerResourceSettings |
containerResourceRequests | Сведения о запросе ресурса контейнера: | ContainerResourceSettings |
ContainerResourceSettings
Имя | Описание | Ценность |
---|---|---|
ЦПУ | Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
Графический процессор | Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
память | Запрос или ограничение размера памяти для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
ManagedOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | Managed (обязательный) |
Sku
Имя | Описание | Ценность |
---|---|---|
способность | Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. | int |
семья | Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. | струна |
имя | Имя номера SKU. Ex - P3. Обычно это код буквы и числа | строка (обязательно) |
размер | Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. | струна |
ярус | Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. | "Базовый" "Бесплатный" "Премиум" "Стандартный" |
Определение ресурса шаблона ARM
Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:
- группы ресурсов . См. команды развертывания группы ресурсов
Список измененных свойств в каждой версии API см. в журнала изменений.
Формат ресурса
Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий код JSON в шаблон.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2024-07-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Объекты OnlineDeploymentProperties
Задайте свойство endpointComputeType, чтобы указать тип объекта.
Для Kubernetesиспользуйте:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Для управляемых
"endpointComputeType": "Managed"
Объекты OnlineScaleSettings
Задайте свойство scaleType, чтобы указать тип объекта.
Для по умолчаниюиспользуйте:
"scaleType": "Default"
Для TargetUtilizationиспользуйте:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Значения свойств
workspaces/onlineEndpoints/deployments
Имя | Описание | Ценность |
---|---|---|
тип | Тип ресурса | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | Версия API ресурсов | '2024-07-01-preview' |
имя | Имя ресурса Узнайте, как задать имена и типы дочерних ресурсов в шаблонах ARM JSON. |
строка (обязательно) |
местоположение | Географическое расположение, в котором находится ресурс | строка (обязательно) |
Теги | Теги ресурсов. | Словарь имен и значений тегов. См. теги в шаблонах |
SKU | Сведения о SKU, необходимые для контракта ARM для автомасштабирования. | Sku |
добрый | Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. | струна |
тождество | Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения | ManagedServiceIdentity |
свойства | [Обязательный] Дополнительные атрибуты сущности. | OnlineDeploymentProperties (обязательно) |
ManagedServiceIdentity
Имя | Описание | Ценность |
---|---|---|
тип | Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). | "Нет" SystemAssigned SystemAssigned, UserAssigned UserAssigned (обязательно) |
userAssignedIdentities | Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. | UserAssignedIdentities |
UserAssignedIdentities
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | UserAssignedIdentity |
UserAssignedIdentity
Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.
OnlineDeploymentProperties
Имя | Описание | Ценность |
---|---|---|
appInsightsEnabled | Если значение true, включает ведение журнала Application Insights. | bool |
codeConfiguration | Конфигурация кода для развертывания конечной точки. | CodeConfiguration |
dataCollector | Конфигурация mdc отключается при значении NULL. | DataCollector |
описание | Описание развертывания конечной точки. | струна |
исходящий трафикPublicNetworkAccess | Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. | "Отключено" "Включено" |
environmentId | Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. | струна |
environmentVariables | Конфигурация переменных среды для развертывания. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Тип вычислительного экземпляра. | струна |
livenessProbe | Проба динамической активности регулярно отслеживает работоспособность контейнера. | ProbeSettings |
модель | Путь URI к модели. | струна |
modelMountPath | Путь к подключению модели в пользовательском контейнере. | струна |
свойства | Словарь свойств. Свойства можно добавлять, но не удалять или изменять. | EndpointDeploymentPropertiesBaseProperties |
готовностьProbe | Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. | ProbeSettings |
requestSettings | Параметры запроса для развертывания. | OnlineRequestSettings |
scaleSettings | Параметры масштабирования развертывания. Если значение равно null или не указано, По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и значение DefaultScaleSettings для ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Установка типа объекта |
Kubernetes Управляемое (обязательно) |
CodeConfiguration
Имя | Описание | Ценность |
---|---|---|
codeId | Идентификатор ресурса ARM ресурса ресурса кода. | струна |
оценкаScript | [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" | строка (обязательно) Ограничения целостности: Минимальная длина = 1 Pattern = [a-zA-Z0-9_] |
DataCollector
Имя | Описание | Ценность |
---|---|---|
Коллекции | [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой. Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала. |
DataCollectorCollections (обязательно) |
requestLogging | Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. | RequestLogging |
скользящей скорости | При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных. |
"День" "Час" "Минута" "Месяц" "Год" |
DataCollectorCollections
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | коллекции |
Коллекция
Имя | Описание | Ценность |
---|---|---|
clientId | Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. | струна |
dataCollectionMode | Включение или отключение сбора данных. | "Отключено" "Включено" |
dataId | Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. | струна |
выборка | Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. | int |
RequestLogging
Имя | Описание | Ценность |
---|---|---|
captureHeaders | Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
ПробыSettings
Имя | Описание | Ценность |
---|---|---|
failureThreshold | Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. | int |
initialDelay | Задержка перед первой пробой в формате ISO 8601. | струна |
период | Продолжительность времени между пробами в формате ISO 8601. | струна |
successThreshold | Количество успешных проб перед возвратом работоспособного состояния. | int |
Времени ожидания | Время ожидания пробы в формате ISO 8601. | струна |
EndpointDeploymentPropertiesBaseProperties
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
OnlineRequestSettings
Имя | Описание | Ценность |
---|---|---|
maxConcurrentRequestsPerInstance | Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. | int |
maxQueueWait | (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601. Значение по умолчанию — 500 мс. (Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей) |
струна |
requestTimeout | Время ожидания оценки в формате ISO 8601. Значение по умолчанию — 5000 мс. |
струна |
OnlineScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | Установка типа объекта |
по умолчанию TargetUtilization (обязательно) |
DefaultScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | Default (обязательно) |
TargetUtilizationScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | TargetUtilization (обязательный) |
maxInstances | Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. | int |
minInstances | Минимальное количество экземпляров, которые всегда должны присутствовать. | int |
pollingInterval | Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. | струна |
targetUtilizationPercentage | Целевое использование ЦП для автомасштабирования. | int |
KubernetesOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | Kubernetes (обязательно) |
containerResourceRequirements | Требования к ресурсам для контейнера (ЦП и памяти). | ContainerResourceRequirements |
ContainerResourceRequirements
Имя | Описание | Ценность |
---|---|---|
containerResourceLimits | Сведения об ограничении ресурсов контейнера: | ContainerResourceSettings |
containerResourceRequests | Сведения о запросе ресурса контейнера: | ContainerResourceSettings |
ContainerResourceSettings
Имя | Описание | Ценность |
---|---|---|
ЦПУ | Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
Графический процессор | Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
память | Запрос или ограничение размера памяти для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
ManagedOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | Managed (обязательный) |
Sku
Имя | Описание | Ценность |
---|---|---|
способность | Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. | int |
семья | Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. | струна |
имя | Имя номера SKU. Ex - P3. Обычно это код буквы и числа | строка (обязательно) |
размер | Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. | струна |
ярус | Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. | "Базовый" "Бесплатный" "Премиум" "Стандартный" |
Определение ресурса Terraform (поставщик AzAPI)
Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:
- групп ресурсов
Список измененных свойств в каждой версии API см. в журнала изменений.
Формат ресурса
Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий объект Terraform в шаблон.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Объекты OnlineDeploymentProperties
Задайте свойство endpointComputeType, чтобы указать тип объекта.
Для Kubernetesиспользуйте:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Для управляемых
endpointComputeType = "Managed"
Объекты OnlineScaleSettings
Задайте свойство scaleType, чтобы указать тип объекта.
Для по умолчаниюиспользуйте:
scaleType = "Default"
Для TargetUtilizationиспользуйте:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Значения свойств
workspaces/onlineEndpoints/deployments
Имя | Описание | Ценность |
---|---|---|
тип | Тип ресурса | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview" |
имя | Имя ресурса | строка (обязательно) |
местоположение | Географическое расположение, в котором находится ресурс | строка (обязательно) |
parent_id | Идентификатор ресурса, который является родительским для этого ресурса. | Идентификатор ресурса типа: onlineEndpoints |
Теги | Теги ресурсов. | Словарь имен и значений тегов. |
SKU | Сведения о SKU, необходимые для контракта ARM для автомасштабирования. | Sku |
добрый | Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. | струна |
тождество | Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения | ManagedServiceIdentity |
свойства | [Обязательный] Дополнительные атрибуты сущности. | OnlineDeploymentProperties (обязательно) |
ManagedServiceIdentity
Имя | Описание | Ценность |
---|---|---|
тип | Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). | SystemAssigned SystemAssigned, UserAssigned UserAssigned (обязательно) |
identity_ids | Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. | Массив идентификаторов удостоверений пользователя. |
UserAssignedIdentities
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | UserAssignedIdentity |
UserAssignedIdentity
Этот объект не содержит свойств, заданных во время развертывания. Все свойства — ReadOnly.
OnlineDeploymentProperties
Имя | Описание | Ценность |
---|---|---|
appInsightsEnabled | Если значение true, включает ведение журнала Application Insights. | bool |
codeConfiguration | Конфигурация кода для развертывания конечной точки. | CodeConfiguration |
dataCollector | Конфигурация mdc отключается при значении NULL. | DataCollector |
описание | Описание развертывания конечной точки. | струна |
исходящий трафикPublicNetworkAccess | Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. | "Отключено" "Включено" |
environmentId | Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. | струна |
environmentVariables | Конфигурация переменных среды для развертывания. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Тип вычислительного экземпляра. | струна |
livenessProbe | Проба динамической активности регулярно отслеживает работоспособность контейнера. | ProbeSettings |
модель | Путь URI к модели. | струна |
modelMountPath | Путь к подключению модели в пользовательском контейнере. | струна |
свойства | Словарь свойств. Свойства можно добавлять, но не удалять или изменять. | EndpointDeploymentPropertiesBaseProperties |
готовностьProbe | Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. | ProbeSettings |
requestSettings | Параметры запроса для развертывания. | OnlineRequestSettings |
scaleSettings | Параметры масштабирования развертывания. Если значение равно null или не указано, По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и значение DefaultScaleSettings для ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Установка типа объекта |
Kubernetes Управляемое (обязательно) |
CodeConfiguration
Имя | Описание | Ценность |
---|---|---|
codeId | Идентификатор ресурса ARM ресурса ресурса кода. | струна |
оценкаScript | [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" | строка (обязательно) Ограничения целостности: Минимальная длина = 1 Pattern = [a-zA-Z0-9_] |
DataCollector
Имя | Описание | Ценность |
---|---|---|
Коллекции | [Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой. Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала. |
DataCollectorCollections (обязательно) |
requestLogging | Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. | RequestLogging |
скользящей скорости | При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных. |
"День" "Час" "Minute" "Месяц" "Год" |
DataCollectorCollections
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | коллекции |
Коллекция
Имя | Описание | Ценность |
---|---|---|
clientId | Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. | струна |
dataCollectionMode | Включение или отключение сбора данных. | "Отключено" "Включено" |
dataId | Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. | струна |
выборка | Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. | int |
RequestLogging
Имя | Описание | Ценность |
---|---|---|
captureHeaders | Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
ПробыSettings
Имя | Описание | Ценность |
---|---|---|
failureThreshold | Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. | int |
initialDelay | Задержка перед первой пробой в формате ISO 8601. | струна |
период | Продолжительность времени между пробами в формате ISO 8601. | струна |
successThreshold | Количество успешных проб перед возвратом работоспособного состояния. | int |
Времени ожидания | Время ожидания пробы в формате ISO 8601. | струна |
EndpointDeploymentPropertiesBaseProperties
Имя | Описание | Ценность |
---|---|---|
{настраиваемое свойство} | струна |
OnlineRequestSettings
Имя | Описание | Ценность |
---|---|---|
maxConcurrentRequestsPerInstance | Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. | int |
maxQueueWait | (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601. Значение по умолчанию — 500 мс. (Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей) |
струна |
requestTimeout | Время ожидания оценки в формате ISO 8601. Значение по умолчанию — 5000 мс. |
струна |
OnlineScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | Установка типа объекта |
по умолчанию TargetUtilization (обязательно) |
DefaultScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | "Default" (обязательно) |
TargetUtilizationScaleSettings
Имя | Описание | Ценность |
---|---|---|
scaleType | [Обязательный] Тип алгоритма масштабирования развертывания | TargetUtilization (обязательный) |
maxInstances | Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. | int |
minInstances | Минимальное количество экземпляров, которые всегда должны присутствовать. | int |
pollingInterval | Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. | струна |
targetUtilizationPercentage | Целевое использование ЦП для автомасштабирования. | int |
KubernetesOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | Kubernetes (обязательно) |
containerResourceRequirements | Требования к ресурсам для контейнера (ЦП и памяти). | ContainerResourceRequirements |
ContainerResourceRequirements
Имя | Описание | Ценность |
---|---|---|
containerResourceLimits | Сведения об ограничении ресурсов контейнера: | ContainerResourceSettings |
containerResourceRequests | Сведения о запросе ресурса контейнера: | ContainerResourceSettings |
ContainerResourceSettings
Имя | Описание | Ценность |
---|---|---|
ЦПУ | Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
Графический процессор | Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
память | Запрос или ограничение размера памяти для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
струна |
ManagedOnlineDeployment
Имя | Описание | Ценность |
---|---|---|
endpointComputeType | [Обязательный] Тип вычислений конечной точки. | "Managed" (обязательно) |
Sku
Имя | Описание | Ценность |
---|---|---|
способность | Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. | int |
семья | Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. | струна |
имя | Имя номера SKU. Ex - P3. Обычно это код буквы и числа | строка (обязательно) |
размер | Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. | струна |
ярус | Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. | "Базовый" "Бесплатный" "Премиум" "Стандартный" |