Online Deployments - List
Список развертываний конечных точек вывода.
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}
Параметры URI
| Имя | В | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Имя конечной точки в Сети. |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
Имя группы ресурсов. Имя не зависит от регистра. |
|
subscription
|
path | True |
string minLength: 1 |
Идентификатор целевой подписки. |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Имя рабочей области Машинного обучения Azure |
|
api-version
|
query | True |
string minLength: 1 |
Версия API, используемая для данной операции. |
|
$order
|
query |
string |
Упорядочение списка. |
|
|
$skip
|
query |
string |
Маркер продолжения для разбиения на страницы. |
|
|
$top
|
query |
integer (int32) |
Верхняя часть списка. |
Ответы
| Имя | Тип | Описание |
|---|---|---|
| 200 OK |
Операция Azure успешно завершена. |
|
| Other Status Codes |
Непредвиденное сообщение об ошибке. |
Безопасность
azure_auth
Поток OAuth2 в Azure Active Directory.
Тип:
oauth2
Flow:
implicit
URL-адрес авторизации:
https://login.microsoftonline.com/common/oauth2/authorize
Области
| Имя | Описание |
|---|---|
| user_impersonation | олицетворения учетной записи пользователя |
Примеры
List Online Deployments.
Образец запроса
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1
Пример ответа
{
"nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
"value": [
{
"name": "string",
"type": "string",
"id": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"clientId": "00000000-1111-2222-3333-444444444444",
"principalId": "00000000-1111-2222-3333-444444444444"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"description": "string",
"appInsightsEnabled": false,
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
},
"containerResourceRequests": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
}
},
"endpointComputeType": "Kubernetes",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": 1,
"initialDelay": "PT5M",
"period": "PT5M",
"successThreshold": 1,
"timeout": "PT5M"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"string": "string"
},
"provisioningState": "Creating",
"requestSettings": {
"maxConcurrentRequestsPerInstance": 1,
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M"
},
"scaleSettings": {
"scaleType": "Default"
}
},
"sku": {
"name": "string",
"capacity": 1,
"family": "string",
"size": "string",
"tier": "Free"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {}
}
]
}
Определения
| Имя | Описание |
|---|---|
|
Code |
Конфигурация для ресурса кода оценки. |
| Collection | |
|
Container |
Требования к ресурсам для каждого экземпляра контейнера в интерактивном развертывании. |
|
Container |
|
|
created |
Тип удостоверения, создавшего ресурс. |
|
Data |
Включение или отключение сбора данных. |
|
Data |
|
|
Default |
|
|
Deployment |
Возможные значения для DeploymentProvisioningState. |
|
Egress |
Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания. |
|
Endpoint |
Перечисление для определения типа вычислений конечной точки. |
|
Error |
Дополнительные сведения об ошибке управления ресурсами. |
|
Error |
Сведения об ошибке. |
|
Error |
Ответ на ошибку |
|
Kubernetes |
Свойства, относящиеся к KubernetesOnlineDeployment. |
|
Managed |
Свойства, относящиеся к ManagedOnlineDeployment. |
|
Managed |
Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения |
|
Managed |
Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). |
|
Online |
Конкретные отслеживаемые типы ресурсов можно создать путем псевдонима этого типа с помощью определенного типа свойства. |
|
Online |
Список сущностей OnlineDeployment с разбивкой на страницы. |
|
Online |
Конфигурация запросов оценки развертывания в Сети. |
|
Probe |
Конфигурация пробы готовности и активности контейнера развертывания. |
|
Request |
|
|
Rolling |
При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных. |
|
Scale |
|
| Sku |
Определение модели ресурсов, представляющее номер SKU |
|
Sku |
Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. |
|
system |
Метаданные, относящиеся к созданию и последнему изменении ресурса. |
|
Target |
|
|
User |
Свойства назначаемого пользователем удостоверения |
CodeConfiguration
Конфигурация для ресурса кода оценки.
| Имя | Тип | Описание |
|---|---|---|
| codeId |
string |
Идентификатор ресурса ARM ресурса ресурса кода. |
| scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Обязательный] Скрипт, выполняемый при запуске. eg. "score.py" |
Collection
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| clientId |
string |
Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности. |
|
| dataCollectionMode | Disabled |
Включение или отключение сбора данных. |
|
| dataId |
string |
Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов. |
|
| samplingRate |
number (double) |
1 |
Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных. |
ContainerResourceRequirements
Требования к ресурсам для каждого экземпляра контейнера в интерактивном развертывании.
| Имя | Тип | Описание |
|---|---|---|
| containerResourceLimits |
Сведения об ограничении ресурсов контейнера: |
|
| containerResourceRequests |
Сведения о запросе ресурса контейнера: |
ContainerResourceSettings
| Имя | Тип | Описание |
|---|---|---|
| cpu |
string |
Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| gpu |
string |
Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| memory |
string |
Запрос или ограничение размера памяти для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
Тип удостоверения, создавшего ресурс.
| Значение | Описание |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
DataCollectionMode
Включение или отключение сбора данных.
| Значение | Описание |
|---|---|
| Enabled | |
| Disabled |
DataCollector
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| collections |
<string, Collection> |
[Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой. Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала. |
|
| requestLogging |
Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно. |
||
| rollingRate | Hour |
При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных. |
DefaultScaleSettings
| Имя | Тип | Описание |
|---|---|---|
| scaleType |
string:
Default |
[Обязательный] Тип алгоритма масштабирования развертывания |
DeploymentProvisioningState
Возможные значения для DeploymentProvisioningState.
| Значение | Описание |
|---|---|
| Creating | |
| Deleting | |
| Scaling | |
| Updating | |
| Succeeded | |
| Failed | |
| Canceled |
EgressPublicNetworkAccessType
Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания.
| Значение | Описание |
|---|---|
| Enabled | |
| Disabled |
EndpointComputeType
Перечисление для определения типа вычислений конечной точки.
| Значение | Описание |
|---|---|
| Managed | |
| Kubernetes | |
| AzureMLCompute |
ErrorAdditionalInfo
Дополнительные сведения об ошибке управления ресурсами.
| Имя | Тип | Описание |
|---|---|---|
| info |
object |
Дополнительные сведения. |
| type |
string |
Дополнительный тип сведений. |
ErrorDetail
Сведения об ошибке.
| Имя | Тип | Описание |
|---|---|---|
| additionalInfo |
Дополнительные сведения об ошибке. |
|
| code |
string |
Код ошибки. |
| details |
Сведения об ошибке. |
|
| message |
string |
Сообщение об ошибке. |
| target |
string |
Целевой объект ошибки. |
ErrorResponse
Ответ на ошибку
| Имя | Тип | Описание |
|---|---|---|
| error |
Объект ошибки. |
KubernetesOnlineDeployment
Свойства, относящиеся к KubernetesOnlineDeployment.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Если значение true, включает ведение журнала Application Insights. |
| codeConfiguration |
Конфигурация кода для развертывания конечной точки. |
||
| containerResourceRequirements |
Требования к ресурсам для контейнера (ЦП и памяти). |
||
| dataCollector |
Конфигурация mdc отключается при значении NULL. |
||
| description |
string |
Описание развертывания конечной точки. |
|
| egressPublicNetworkAccess | Enabled |
Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания. |
|
| endpointComputeType |
string:
Kubernetes |
[Обязательный] Тип вычислений конечной точки. |
|
| environmentId |
string |
Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. |
|
| environmentVariables |
object |
Конфигурация переменных среды для развертывания. |
|
| instanceType |
string |
Standard_F4s_v2 |
Тип вычислительного экземпляра. По умолчанию: Standard_F4s_v2. |
| livenessProbe |
Проба динамической активности регулярно отслеживает работоспособность контейнера. |
||
| model |
string |
Путь URI к модели. |
|
| modelMountPath |
string |
Путь к подключению модели в пользовательском контейнере. |
|
| properties |
object |
Словарь свойств. Свойства можно добавлять, но не удалять или изменять. |
|
| provisioningState |
Состояние подготовки для развертывания конечной точки. |
||
| readinessProbe |
Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. |
||
| requestSettings |
Параметры запроса для развертывания. |
||
| scaleSettings | OnlineScaleSettings: |
Параметры масштабирования развертывания. Если значение равно null или оно не указано, по умолчанию используется значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и DefaultScaleSettings для ManagedOnlineDeployment. |
|
| startupProbe |
Проверка запуска проверяет, успешно ли запущено приложение в контейнере. |
ManagedOnlineDeployment
Свойства, относящиеся к ManagedOnlineDeployment.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Если значение true, включает ведение журнала Application Insights. |
| codeConfiguration |
Конфигурация кода для развертывания конечной точки. |
||
| dataCollector |
Конфигурация mdc отключается при значении NULL. |
||
| description |
string |
Описание развертывания конечной точки. |
|
| egressPublicNetworkAccess | Enabled |
Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания. |
|
| endpointComputeType |
string:
Managed |
[Обязательный] Тип вычислений конечной точки. |
|
| environmentId |
string |
Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. |
|
| environmentVariables |
object |
Конфигурация переменных среды для развертывания. |
|
| instanceType |
string |
Standard_F4s_v2 |
Тип вычислительного экземпляра. По умолчанию: Standard_F4s_v2. |
| livenessProbe |
Проба динамической активности регулярно отслеживает работоспособность контейнера. |
||
| model |
string |
Путь URI к модели. |
|
| modelMountPath |
string |
Путь к подключению модели в пользовательском контейнере. |
|
| properties |
object |
Словарь свойств. Свойства можно добавлять, но не удалять или изменять. |
|
| provisioningState |
Состояние подготовки для развертывания конечной точки. |
||
| readinessProbe |
Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. |
||
| requestSettings |
Параметры запроса для развертывания. |
||
| scaleSettings | OnlineScaleSettings: |
Параметры масштабирования развертывания. Если значение равно null или оно не указано, по умолчанию используется значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и DefaultScaleSettings для ManagedOnlineDeployment. |
|
| startupProbe |
Проверка запуска проверяет, успешно ли запущено приложение в контейнере. |
ManagedServiceIdentity
Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения
| Имя | Тип | Описание |
|---|---|---|
| principalId |
string (uuid) |
Идентификатор субъекта-службы назначенного системой удостоверения. Это свойство будет предоставлено только для назначаемого системой удостоверения. |
| tenantId |
string (uuid) |
Идентификатор клиента назначенного системой удостоверения. Это свойство будет предоставлено только для назначаемого системой удостоверения. |
| type |
Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). |
|
| userAssignedIdentities |
<string,
User |
удостоверения User-Assigned |
ManagedServiceIdentityType
Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned).
| Значение | Описание |
|---|---|
| None | |
| SystemAssigned | |
| UserAssigned | |
| SystemAssigned,UserAssigned |
OnlineDeployment
Конкретные отслеживаемые типы ресурсов можно создать путем псевдонима этого типа с помощью определенного типа свойства.
| Имя | Тип | Описание |
|---|---|---|
| id |
string |
Полный идентификатор ресурса для ресурса. Пример - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| identity |
Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения |
|
| kind |
string |
Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. |
| location |
string |
Географическое расположение, в котором находится ресурс |
| name |
string |
Имя ресурса. |
| properties | OnlineDeploymentProperties: |
[Обязательный] Дополнительные атрибуты сущности. |
| sku |
Сведения о SKU, необходимые для контракта ARM для автомасштабирования. |
|
| systemData |
Метаданные Azure Resource Manager, содержащие данные createdBy и modifiedBy. |
|
| tags |
object |
Теги ресурсов. |
| type |
string |
Тип ресурса. Например, "Microsoft.Compute/virtualMachines" или "Microsoft.Storage/storageAccounts" |
OnlineDeploymentTrackedResourceArmPaginatedResult
Список сущностей OnlineDeployment с разбивкой на страницы.
| Имя | Тип | Описание |
|---|---|---|
| nextLink |
string (uri) |
Ссылка на следующую страницу элементов |
| value |
Пункты OnlineDeployment на этой странице |
OnlineRequestSettings
Конфигурация запросов оценки развертывания в Сети.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| maxConcurrentRequestsPerInstance |
integer (int32) |
1 |
Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. |
| maxQueueWait |
string (duration) |
PT0.5S |
(Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте |
| requestTimeout |
string (duration) |
PT5S |
Время ожидания оценки в формате ISO 8601. Значение по умолчанию — 5000 мс. |
ProbeSettings
Конфигурация пробы готовности и активности контейнера развертывания.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| failureThreshold |
integer (int32) |
30 |
Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. |
| initialDelay |
string (duration) |
Задержка перед первой пробой в формате ISO 8601. |
|
| period |
string (duration) |
PT10S |
Продолжительность времени между пробами в формате ISO 8601. |
| successThreshold |
integer (int32) |
1 |
Количество успешных проб перед возвратом работоспособного состояния. |
| timeout |
string (duration) |
PT2S |
Время ожидания пробы в формате ISO 8601. |
RequestLogging
| Имя | Тип | Описание |
|---|---|---|
| captureHeaders |
string[] |
Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными. |
RollingRateType
При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.
| Значение | Описание |
|---|---|
| Year | |
| Month | |
| Day | |
| Hour | |
| Minute |
ScaleType
| Значение | Описание |
|---|---|
| Default | |
| TargetUtilization |
Sku
Определение модели ресурсов, представляющее номер SKU
| Имя | Тип | Описание |
|---|---|---|
| capacity |
integer (int32) |
Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. |
| family |
string |
Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. |
| name |
string |
Имя номера SKU. Пример - П3. Обычно это код буквы и числа |
| size |
string |
Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. |
| tier |
Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. |
SkuTier
Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT.
| Значение | Описание |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium |
systemData
Метаданные, относящиеся к созданию и последнему изменении ресурса.
| Имя | Тип | Описание |
|---|---|---|
| createdAt |
string (date-time) |
Метка времени создания ресурса (UTC). |
| createdBy |
string |
Удостоверение, создающее ресурс. |
| createdByType |
Тип удостоверения, создавшего ресурс. |
|
| lastModifiedAt |
string (date-time) |
Временная метка последнего изменения ресурса (UTC) |
| lastModifiedBy |
string |
Идентификатор, который последний раз изменил ресурс. |
| lastModifiedByType |
Тип удостоверения, который последний раз изменил ресурс. |
TargetUtilizationScaleSettings
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| maxInstances |
integer (int32) |
1 |
Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. |
| minInstances |
integer (int32) |
1 |
Минимальное количество экземпляров, которые всегда должны присутствовать. |
| pollingInterval |
string (duration) |
PT1S |
Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. |
| scaleType |
string:
Target |
[Обязательный] Тип алгоритма масштабирования развертывания |
|
| targetUtilizationPercentage |
integer (int32) |
70 |
Целевое использование ЦП для автомасштабирования. |
UserAssignedIdentity
Свойства назначаемого пользователем удостоверения
| Имя | Тип | Описание |
|---|---|---|
| clientId |
string (uuid) |
Идентификатор клиента назначенного удостоверения. |
| principalId |
string (uuid) |
Основной идентификатор назначенного удостоверения. |