Поделиться через


Online Deployments - List

Список развертываний конечных точек вывода.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

Параметры URI

Имя В Обязательно Тип Описание
endpointName
path True

string

Имя конечной точки в Сети.

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Имя группы ресурсов. Имя не зависит от регистра.

subscriptionId
path True

string

minLength: 1

Идентификатор целевой подписки.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Имя рабочей области Машинного обучения Azure

api-version
query True

string

minLength: 1

Версия API, используемая для данной операции.

$orderBy
query

string

Упорядочение списка.

$skip
query

string

Маркер продолжения для разбиения на страницы.

$top
query

integer (int32)

Верхняя часть списка.

Ответы

Имя Тип Описание
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Операция Azure успешно завершена.

Other Status Codes

ErrorResponse

Непредвиденное сообщение об ошибке.

Безопасность

azure_auth

Поток OAuth2 в Azure Active Directory.

Тип: oauth2
Flow: implicit
URL-адрес авторизации: https://login.microsoftonline.com/common/oauth2/authorize

Области

Имя Описание
user_impersonation олицетворения учетной записи пользователя

Примеры

List Online Deployments.

Образец запроса

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1

Пример ответа

{
  "nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
  "value": [
    {
      "name": "string",
      "type": "string",
      "id": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "clientId": "00000000-1111-2222-3333-444444444444",
            "principalId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "kind": "string",
      "location": "string",
      "properties": {
        "description": "string",
        "appInsightsEnabled": false,
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "containerResourceRequirements": {
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          },
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          }
        },
        "endpointComputeType": "Kubernetes",
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "instanceType": "string",
        "livenessProbe": {
          "failureThreshold": 1,
          "initialDelay": "PT5M",
          "period": "PT5M",
          "successThreshold": 1,
          "timeout": "PT5M"
        },
        "model": "string",
        "modelMountPath": "string",
        "properties": {
          "string": "string"
        },
        "provisioningState": "Creating",
        "requestSettings": {
          "maxConcurrentRequestsPerInstance": 1,
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M"
        },
        "scaleSettings": {
          "scaleType": "Default"
        }
      },
      "sku": {
        "name": "string",
        "capacity": 1,
        "family": "string",
        "size": "string",
        "tier": "Free"
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {}
    }
  ]
}

Определения

Имя Описание
CodeConfiguration

Конфигурация для ресурса кода оценки.

Collection
ContainerResourceRequirements

Требования к ресурсам для каждого экземпляра контейнера в интерактивном развертывании.

ContainerResourceSettings
createdByType

Тип удостоверения, создавшего ресурс.

DataCollectionMode

Включение или отключение сбора данных.

DataCollector
DefaultScaleSettings
DeploymentProvisioningState

Возможные значения для DeploymentProvisioningState.

EgressPublicNetworkAccessType

Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания.

EndpointComputeType

Перечисление для определения типа вычислений конечной точки.

ErrorAdditionalInfo

Дополнительные сведения об ошибке управления ресурсами.

ErrorDetail

Сведения об ошибке.

ErrorResponse

Ответ на ошибку

KubernetesOnlineDeployment

Свойства, относящиеся к KubernetesOnlineDeployment.

ManagedOnlineDeployment

Свойства, относящиеся к ManagedOnlineDeployment.

ManagedServiceIdentity

Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения

ManagedServiceIdentityType

Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned).

OnlineDeployment

Конкретные отслеживаемые типы ресурсов можно создать путем псевдонима этого типа с помощью определенного типа свойства.

OnlineDeploymentTrackedResourceArmPaginatedResult

Список сущностей OnlineDeployment с разбивкой на страницы.

OnlineRequestSettings

Конфигурация запросов оценки развертывания в Сети.

ProbeSettings

Конфигурация пробы готовности и активности контейнера развертывания.

RequestLogging
RollingRateType

При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.

ScaleType
Sku

Определение модели ресурсов, представляющее номер SKU

SkuTier

Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT.

systemData

Метаданные, относящиеся к созданию и последнему изменении ресурса.

TargetUtilizationScaleSettings
UserAssignedIdentity

Свойства назначаемого пользователем удостоверения

CodeConfiguration

Конфигурация для ресурса кода оценки.

Имя Тип Описание
codeId

string

Идентификатор ресурса ARM ресурса ресурса кода.

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[Обязательный] Скрипт, выполняемый при запуске. eg. "score.py"

Collection

Имя Тип Default value Описание
clientId

string

Идентификатор клиента MSI, используемый для сбора журналов в хранилище BLOB-объектов. Если это значение NULL, серверная часть выберет зарегистрированное удостоверение конечной точки для проверки подлинности.

dataCollectionMode

DataCollectionMode

Disabled

Включение или отключение сбора данных.

dataId

string

Идентификатор ресурса Клиентская сторона гарантирует, что ресурс данных указывает на хранилище BLOB-объектов, а серверная часть собирает данные в хранилище BLOB-объектов.

samplingRate

number (double)

1

Частота выборки для коллекции. Частота выборки 1.0 означает, что по умолчанию мы собираем 100% данных.

ContainerResourceRequirements

Требования к ресурсам для каждого экземпляра контейнера в интерактивном развертывании.

Имя Тип Описание
containerResourceLimits

ContainerResourceSettings

Сведения об ограничении ресурсов контейнера:

containerResourceRequests

ContainerResourceSettings

Сведения о запросе ресурса контейнера:

ContainerResourceSettings

Имя Тип Описание
cpu

string

Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Запрос или ограничение размера памяти для контейнера. Дополнительные сведения: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Тип удостоверения, создавшего ресурс.

Значение Описание
User
Application
ManagedIdentity
Key

DataCollectionMode

Включение или отключение сбора данных.

Значение Описание
Enabled
Disabled

DataCollector

Имя Тип Default value Описание
collections

<string,  Collection>

[Обязательный] Конфигурация коллекции. Каждая коллекция имеет собственную конфигурацию для сбора данных модели, а имя коллекции может быть произвольной строкой. Сборщик данных модели можно использовать для ведения журнала полезных данных или пользовательского ведения журнала или обоих из них. Запросы и ответы коллекции зарезервированы для ведения журнала полезных данных, другие — для пользовательского ведения журнала.

requestLogging

RequestLogging

Конфигурация ведения журнала запросов для MDC включает расширенные параметры ведения журнала для всех коллекций. Это необязательно.

rollingRate

RollingRateType

Hour

При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.

DefaultScaleSettings

Имя Тип Описание
scaleType string:

Default

[Обязательный] Тип алгоритма масштабирования развертывания

DeploymentProvisioningState

Возможные значения для DeploymentProvisioningState.

Значение Описание
Creating
Deleting
Scaling
Updating
Succeeded
Failed
Canceled

EgressPublicNetworkAccessType

Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания.

Значение Описание
Enabled
Disabled

EndpointComputeType

Перечисление для определения типа вычислений конечной точки.

Значение Описание
Managed
Kubernetes
AzureMLCompute

ErrorAdditionalInfo

Дополнительные сведения об ошибке управления ресурсами.

Имя Тип Описание
info

object

Дополнительные сведения.

type

string

Дополнительный тип сведений.

ErrorDetail

Сведения об ошибке.

Имя Тип Описание
additionalInfo

ErrorAdditionalInfo[]

Дополнительные сведения об ошибке.

code

string

Код ошибки.

details

ErrorDetail[]

Сведения об ошибке.

message

string

Сообщение об ошибке.

target

string

Целевой объект ошибки.

ErrorResponse

Ответ на ошибку

Имя Тип Описание
error

ErrorDetail

Объект ошибки.

KubernetesOnlineDeployment

Свойства, относящиеся к KubernetesOnlineDeployment.

Имя Тип Default value Описание
appInsightsEnabled

boolean

False

Если значение true, включает ведение журнала Application Insights.

codeConfiguration

CodeConfiguration

Конфигурация кода для развертывания конечной точки.

containerResourceRequirements

ContainerResourceRequirements

Требования к ресурсам для контейнера (ЦП и памяти).

dataCollector

DataCollector

Конфигурация mdc отключается при значении NULL.

description

string

Описание развертывания конечной точки.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания.

endpointComputeType string:

Kubernetes

[Обязательный] Тип вычислений конечной точки.

environmentId

string

Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки.

environmentVariables

object

Конфигурация переменных среды для развертывания.

instanceType

string

Standard_F4s_v2

Тип вычислительного экземпляра. По умолчанию: Standard_F4s_v2.

livenessProbe

ProbeSettings

Проба динамической активности регулярно отслеживает работоспособность контейнера.

model

string

Путь URI к модели.

modelMountPath

string

Путь к подключению модели в пользовательском контейнере.

properties

object

Словарь свойств. Свойства можно добавлять, но не удалять или изменять.

provisioningState

DeploymentProvisioningState

Состояние подготовки для развертывания конечной точки.

readinessProbe

ProbeSettings

Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности.

requestSettings

OnlineRequestSettings

Параметры запроса для развертывания.

scaleSettings OnlineScaleSettings:

Параметры масштабирования развертывания. Если значение равно null или оно не указано, по умолчанию используется значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и DefaultScaleSettings для ManagedOnlineDeployment.

startupProbe

ProbeSettings

Проверка запуска проверяет, успешно ли запущено приложение в контейнере.

ManagedOnlineDeployment

Свойства, относящиеся к ManagedOnlineDeployment.

Имя Тип Default value Описание
appInsightsEnabled

boolean

False

Если значение true, включает ведение журнала Application Insights.

codeConfiguration

CodeConfiguration

Конфигурация кода для развертывания конечной точки.

dataCollector

DataCollector

Конфигурация mdc отключается при значении NULL.

description

string

Описание развертывания конечной точки.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Перечисление, чтобы определить, включен или отключен PublicNetworkAccess для исходящего развертывания.

endpointComputeType string:

Managed

[Обязательный] Тип вычислений конечной точки.

environmentId

string

Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки.

environmentVariables

object

Конфигурация переменных среды для развертывания.

instanceType

string

Standard_F4s_v2

Тип вычислительного экземпляра. По умолчанию: Standard_F4s_v2.

livenessProbe

ProbeSettings

Проба динамической активности регулярно отслеживает работоспособность контейнера.

model

string

Путь URI к модели.

modelMountPath

string

Путь к подключению модели в пользовательском контейнере.

properties

object

Словарь свойств. Свойства можно добавлять, но не удалять или изменять.

provisioningState

DeploymentProvisioningState

Состояние подготовки для развертывания конечной точки.

readinessProbe

ProbeSettings

Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности.

requestSettings

OnlineRequestSettings

Параметры запроса для развертывания.

scaleSettings OnlineScaleSettings:

Параметры масштабирования развертывания. Если значение равно null или оно не указано, по умолчанию используется значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment и DefaultScaleSettings для ManagedOnlineDeployment.

startupProbe

ProbeSettings

Проверка запуска проверяет, успешно ли запущено приложение в контейнере.

ManagedServiceIdentity

Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения

Имя Тип Описание
principalId

string (uuid)

Идентификатор субъекта-службы назначенного системой удостоверения. Это свойство будет предоставлено только для назначаемого системой удостоверения.

tenantId

string (uuid)

Идентификатор клиента назначенного системой удостоверения. Это свойство будет предоставлено только для назначаемого системой удостоверения.

type

ManagedServiceIdentityType

Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned).

userAssignedIdentities

<string,  UserAssignedIdentity>

удостоверения User-Assigned
Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах.

ManagedServiceIdentityType

Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned).

Значение Описание
None
SystemAssigned
UserAssigned
SystemAssigned,UserAssigned

OnlineDeployment

Конкретные отслеживаемые типы ресурсов можно создать путем псевдонима этого типа с помощью определенного типа свойства.

Имя Тип Описание
id

string

Полный идентификатор ресурса для ресурса. Пример - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения

kind

string

Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа.

location

string

Географическое расположение, в котором находится ресурс

name

string

Имя ресурса.

properties OnlineDeploymentProperties:

[Обязательный] Дополнительные атрибуты сущности.

sku

Sku

Сведения о SKU, необходимые для контракта ARM для автомасштабирования.

systemData

systemData

Метаданные Azure Resource Manager, содержащие данные createdBy и modifiedBy.

tags

object

Теги ресурсов.

type

string

Тип ресурса. Например, "Microsoft.Compute/virtualMachines" или "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

Список сущностей OnlineDeployment с разбивкой на страницы.

Имя Тип Описание
nextLink

string (uri)

Ссылка на следующую страницу элементов

value

OnlineDeployment[]

Пункты OnlineDeployment на этой странице

OnlineRequestSettings

Конфигурация запросов оценки развертывания в Сети.

Имя Тип Default value Описание
maxConcurrentRequestsPerInstance

integer (int32)

1

Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1.

maxQueueWait

string (duration)

PT0.5S

(Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601. Значение по умолчанию — 500 мс. (Теперь увеличьте request_timeout_ms учет любых задержек сети или очередей)

requestTimeout

string (duration)

PT5S

Время ожидания оценки в формате ISO 8601. Значение по умолчанию — 5000 мс.

ProbeSettings

Конфигурация пробы готовности и активности контейнера развертывания.

Имя Тип Default value Описание
failureThreshold

integer (int32)

30

Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние.

initialDelay

string (duration)

Задержка перед первой пробой в формате ISO 8601.

period

string (duration)

PT10S

Продолжительность времени между пробами в формате ISO 8601.

successThreshold

integer (int32)

1

Количество успешных проб перед возвратом работоспособного состояния.

timeout

string (duration)

PT2S

Время ожидания пробы в формате ISO 8601.

RequestLogging

Имя Тип Описание
captureHeaders

string[]

Для ведения журнала полезных данных мы собираем полезные данные только по умолчанию. Если клиенты также хотят собирать указанные заголовки, они могут задать их в captureHeaders, чтобы серверная часть собирала эти заголовки вместе с полезными данными.

RollingRateType

При сборе данных модели в хранилище BLOB-объектов необходимо свернуть данные в другой путь, чтобы избежать ведения журнала всех данных в одном файле BLOB-объектов. Если скорость передачи составляет час, все данные будут собираться в пути к BLOB-объектам /гггг/ММ/дд/HH/. Если это день, все данные будут собираться в пути к BLOB-объекту /гггг/ММ/dd/. Другим преимуществом скользящего пути является то, что пользовательский интерфейс мониторинга модели может быстро выбрать диапазон времени данных.

Значение Описание
Year
Month
Day
Hour
Minute

ScaleType

Значение Описание
Default
TargetUtilization

Sku

Определение модели ресурсов, представляющее номер SKU

Имя Тип Описание
capacity

integer (int32)

Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено.

family

string

Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь.

name

string

Имя номера SKU. Пример - П3. Обычно это код буквы и числа

size

string

Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код.

tier

SkuTier

Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT.

SkuTier

Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT.

Значение Описание
Free
Basic
Standard
Premium

systemData

Метаданные, относящиеся к созданию и последнему изменении ресурса.

Имя Тип Описание
createdAt

string (date-time)

Метка времени создания ресурса (UTC).

createdBy

string

Удостоверение, создающее ресурс.

createdByType

createdByType

Тип удостоверения, создавшего ресурс.

lastModifiedAt

string (date-time)

Временная метка последнего изменения ресурса (UTC)

lastModifiedBy

string

Идентификатор, который последний раз изменил ресурс.

lastModifiedByType

createdByType

Тип удостоверения, который последний раз изменил ресурс.

TargetUtilizationScaleSettings

Имя Тип Default value Описание
maxInstances

integer (int32)

1

Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances.

minInstances

integer (int32)

1

Минимальное количество экземпляров, которые всегда должны присутствовать.

pollingInterval

string (duration)

PT1S

Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд.

scaleType string:

TargetUtilization

[Обязательный] Тип алгоритма масштабирования развертывания

targetUtilizationPercentage

integer (int32)

70

Целевое использование ЦП для автомасштабирования.

UserAssignedIdentity

Свойства назначаемого пользователем удостоверения

Имя Тип Описание
clientId

string (uuid)

Идентификатор клиента назначенного удостоверения.

principalId

string (uuid)

Основной идентификатор назначенного удостоверения.