Compartir a través de


Online Deployments - List

Enumerar implementaciones de puntos de conexión de inferencia.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

Parámetros de identificador URI

Nombre En Requerido Tipo Description
endpointName
path True

string

Nombre del punto de conexión en línea.

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Nombre del grupo de recursos. El nombre distingue mayúsculas de minúsculas.

subscriptionId
path True

string

minLength: 1

Identificador de la suscripción de destino.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Nombre del área de trabajo de Azure Machine Learning

api-version
query True

string

minLength: 1

Versión de API que se usará para esta operación.

$orderBy
query

string

Ordenación de la lista.

$skip
query

string

Token de continuación para la paginación.

$top
query

integer (int32)

Parte superior de la lista.

Respuestas

Nombre Tipo Description
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

La operación de Azure se completó correctamente.

Other Status Codes

ErrorResponse

Una respuesta de error inesperada.

Seguridad

azure_auth

Flujo de OAuth2 de Azure Active Directory.

Tipo: oauth2
Flujo: implicit
Dirección URL de autorización: https://login.microsoftonline.com/common/oauth2/authorize

Ámbitos

Nombre Description
user_impersonation suplantar la cuenta de usuario

Ejemplos

List Online Deployments.

Solicitud de ejemplo

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1

Respuesta de muestra

{
  "nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
  "value": [
    {
      "name": "string",
      "type": "string",
      "id": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "clientId": "00000000-1111-2222-3333-444444444444",
            "principalId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "kind": "string",
      "location": "string",
      "properties": {
        "description": "string",
        "appInsightsEnabled": false,
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "containerResourceRequirements": {
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          },
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          }
        },
        "endpointComputeType": "Kubernetes",
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "instanceType": "string",
        "livenessProbe": {
          "failureThreshold": 1,
          "initialDelay": "PT5M",
          "period": "PT5M",
          "successThreshold": 1,
          "timeout": "PT5M"
        },
        "model": "string",
        "modelMountPath": "string",
        "properties": {
          "string": "string"
        },
        "provisioningState": "Creating",
        "requestSettings": {
          "maxConcurrentRequestsPerInstance": 1,
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M"
        },
        "scaleSettings": {
          "scaleType": "Default"
        }
      },
      "sku": {
        "name": "string",
        "capacity": 1,
        "family": "string",
        "size": "string",
        "tier": "Free"
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {}
    }
  ]
}

Definiciones

Nombre Description
CodeConfiguration

Configuración de un recurso de código de puntuación.

Collection
ContainerResourceRequirements

Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea.

ContainerResourceSettings
createdByType

Tipo de identidad que creó el recurso.

DataCollectionMode

Habilite o deshabilite la recopilación de datos.

DataCollector
DefaultScaleSettings
DeploymentProvisioningState

Valores posibles para DeploymentProvisioningState.

EgressPublicNetworkAccessType

Enumeración para determinar si PublicNetworkAccess está habilitado o deshabilitado para la salida de una implementación.

EndpointComputeType

Enumeración para determinar el tipo de proceso del punto de conexión.

ErrorAdditionalInfo

Información adicional sobre el error de administración de recursos.

ErrorDetail

Detalle del error.

ErrorResponse

Respuesta de error

KubernetesOnlineDeployment

Propiedades específicas de KubernetesOnlineDeployment.

ManagedOnlineDeployment

Propiedades específicas de ManagedOnlineDeployment.

ManagedServiceIdentity

Identidad de servicio administrada (identidades asignadas por el sistema o asignadas por el usuario)

ManagedServiceIdentityType

Tipo de identidad de servicio administrada (donde se permiten los tipos SystemAssigned y UserAssigned).

OnlineDeployment

Los tipos de recursos de seguimiento concreto se pueden crear mediante el alias de este tipo mediante un tipo de propiedad específico.

OnlineDeploymentTrackedResourceArmPaginatedResult

Una lista paginada de entidades OnlineDeployment.

OnlineRequestSettings

Configuración de solicitudes de puntuación de implementación en línea.

ProbeSettings

Configuración del sondeo de preparación y ejecución del contenedor de implementación.

RequestLogging
RollingRateType

Cuando los datos del modelo se recopilan en Blob Storage, es necesario implementar los datos en una ruta de acceso diferente para evitar el registro de todos ellos en un solo archivo de blobs. Si la velocidad gradual es de hora, todos los datos se recopilarán en la ruta de acceso del blob /yyyy/MM/dd/HH/. Si es día, todos los datos se recopilarán en la ruta de acceso del blob /aaaa/MM/dd/. La otra ventaja de la ruta de acceso gradual es que la interfaz de usuario de supervisión de modelos puede seleccionar un intervalo de tiempo de datos muy rápidamente.

ScaleType
Sku

Definición del modelo de recursos que representa la SKU

SkuTier

El proveedor de recursos necesita implementar este campo si el servicio tiene más de un nivel, pero no es necesario en put.

systemData

Metadatos relativos a la creación y última modificación del recurso.

TargetUtilizationScaleSettings
UserAssignedIdentity

Propiedades de identidad asignadas por el usuario

CodeConfiguration

Configuración de un recurso de código de puntuación.

Nombre Tipo Description
codeId

string

Identificador de recurso de ARM del recurso de código.

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[Obligatorio] Script que se va a ejecutar al iniciarse. eg. "score.py"

Collection

Nombre Tipo Valor predeterminado Description
clientId

string

Identificador de cliente msi que se usa para recopilar el registro en Blob Storage. Si es null, el back-end elegirá una identidad de punto de conexión registrado para la autenticación.

dataCollectionMode

DataCollectionMode

Disabled

Habilite o deshabilite la recopilación de datos.

dataId

string

Identificador de recurso del arm del recurso de datos. El lado cliente garantizará que el recurso de datos apunte al almacenamiento de blobs y el back-end recopilará datos en el almacenamiento de blobs.

samplingRate

number (double)

1

Frecuencia de muestreo para la recopilación. La frecuencia de muestreo 1,0 significa que recopilamos 100% de datos de forma predeterminada.

ContainerResourceRequirements

Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea.

Nombre Tipo Description
containerResourceLimits

ContainerResourceSettings

Información de límite de recursos de contenedor:

containerResourceRequests

ContainerResourceSettings

Información de solicitud de recursos de contenedor:

ContainerResourceSettings

Nombre Tipo Description
cpu

string

Número de solicitudes o límites de vCPU para el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Número de tarjetas gpu de Nvidia request/limit para el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Solicitud o límite de tamaño de memoria para el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Tipo de identidad que creó el recurso.

Valor Description
User
Application
ManagedIdentity
Key

DataCollectionMode

Habilite o deshabilite la recopilación de datos.

Valor Description
Enabled
Disabled

DataCollector

Nombre Tipo Valor predeterminado Description
collections

<string,  Collection>

[Obligatorio] Configuración de la colección. Cada colección tiene su propia configuración para recopilar datos del modelo y el nombre de la colección puede ser una cadena arbitraria. El recopilador de datos del modelo se puede usar para el registro de carga o para el registro personalizado o para ambos. La solicitud de recopilación y la respuesta están reservadas para el registro de carga, otras son para el registro personalizado.

requestLogging

RequestLogging

La configuración de registro de solicitudes para mdc, incluye opciones de registro avanzadas para todas las colecciones. Es opcional.

rollingRate

RollingRateType

Hour

Cuando los datos del modelo se recopilan en Blob Storage, es necesario implementar los datos en una ruta de acceso diferente para evitar el registro de todos ellos en un solo archivo de blobs. Si la velocidad gradual es de hora, todos los datos se recopilarán en la ruta de acceso del blob /yyyy/MM/dd/HH/. Si es día, todos los datos se recopilarán en la ruta de acceso del blob /aaaa/MM/dd/. La otra ventaja de la ruta de acceso gradual es que la interfaz de usuario de supervisión de modelos puede seleccionar un intervalo de tiempo de datos muy rápidamente.

DefaultScaleSettings

Nombre Tipo Description
scaleType string:

Default

[Obligatorio] Tipo de algoritmo de escalado de implementación

DeploymentProvisioningState

Valores posibles para DeploymentProvisioningState.

Valor Description
Creating
Deleting
Scaling
Updating
Succeeded
Failed
Canceled

EgressPublicNetworkAccessType

Enumeración para determinar si PublicNetworkAccess está habilitado o deshabilitado para la salida de una implementación.

Valor Description
Enabled
Disabled

EndpointComputeType

Enumeración para determinar el tipo de proceso del punto de conexión.

Valor Description
Managed
Kubernetes
AzureMLCompute

ErrorAdditionalInfo

Información adicional sobre el error de administración de recursos.

Nombre Tipo Description
info

object

Información adicional.

type

string

Tipo de información adicional.

ErrorDetail

Detalle del error.

Nombre Tipo Description
additionalInfo

ErrorAdditionalInfo[]

Información adicional del error.

code

string

Código de error.

details

ErrorDetail[]

Detalles del error.

message

string

El mensaje de error.

target

string

Destino del error.

ErrorResponse

Respuesta de error

Nombre Tipo Description
error

ErrorDetail

Objeto de error.

KubernetesOnlineDeployment

Propiedades específicas de KubernetesOnlineDeployment.

Nombre Tipo Valor predeterminado Description
appInsightsEnabled

boolean

False

Si es true, habilita el registro de Application Insights.

codeConfiguration

CodeConfiguration

Configuración de código para la implementación del punto de conexión.

containerResourceRequirements

ContainerResourceRequirements

Requisitos de recursos para el contenedor (cpu y memoria).

dataCollector

DataCollector

La configuración de mdc, deshabilitamos mdc cuando es null.

description

string

Descripción de la implementación del punto de conexión.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Enumeración para determinar si PublicNetworkAccess está habilitado o deshabilitado para la salida de una implementación.

endpointComputeType string:

Kubernetes

[Obligatorio] Tipo de proceso del punto de conexión.

environmentId

string

Identificador de recurso de ARM o AssetId de la especificación del entorno para la implementación del punto de conexión.

environmentVariables

object

Configuración de variables de entorno para la implementación.

instanceType

string

Standard_F4s_v2

Tipo de instancia de proceso. Valor predeterminado: Standard_F4s_v2.

livenessProbe

ProbeSettings

El sondeo de ejecución supervisa periódicamente el estado del contenedor.

model

string

Ruta de acceso del URI al modelo.

modelMountPath

string

Ruta de acceso para montar el modelo en un contenedor personalizado.

properties

object

Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar.

provisioningState

DeploymentProvisioningState

Estado de aprovisionamiento para la implementación del punto de conexión.

readinessProbe

ProbeSettings

El sondeo de preparación valida si el contenedor está listo para atender el tráfico. Las propiedades y los valores predeterminados son los mismos que el sondeo de ejecución.

requestSettings

OnlineRequestSettings

Configuración de la solicitud para la implementación.

scaleSettings OnlineScaleSettings:

Configuración de escalado para la implementación. Si es null o no se proporciona, el valor predeterminado es TargetUtilizationScaleSettings para KubernetesOnlineDeployment y DefaultScaleSettings para ManagedOnlineDeployment.

startupProbe

ProbeSettings

El sondeo de inicio comprueba si una aplicación dentro de un contenedor se ha iniciado correctamente.

ManagedOnlineDeployment

Propiedades específicas de ManagedOnlineDeployment.

Nombre Tipo Valor predeterminado Description
appInsightsEnabled

boolean

False

Si es true, habilita el registro de Application Insights.

codeConfiguration

CodeConfiguration

Configuración de código para la implementación del punto de conexión.

dataCollector

DataCollector

La configuración de mdc, deshabilitamos mdc cuando es null.

description

string

Descripción de la implementación del punto de conexión.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Enumeración para determinar si PublicNetworkAccess está habilitado o deshabilitado para la salida de una implementación.

endpointComputeType string:

Managed

[Obligatorio] Tipo de proceso del punto de conexión.

environmentId

string

Identificador de recurso de ARM o AssetId de la especificación del entorno para la implementación del punto de conexión.

environmentVariables

object

Configuración de variables de entorno para la implementación.

instanceType

string

Standard_F4s_v2

Tipo de instancia de proceso. Valor predeterminado: Standard_F4s_v2.

livenessProbe

ProbeSettings

El sondeo de ejecución supervisa periódicamente el estado del contenedor.

model

string

Ruta de acceso del URI al modelo.

modelMountPath

string

Ruta de acceso para montar el modelo en un contenedor personalizado.

properties

object

Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar.

provisioningState

DeploymentProvisioningState

Estado de aprovisionamiento para la implementación del punto de conexión.

readinessProbe

ProbeSettings

El sondeo de preparación valida si el contenedor está listo para atender el tráfico. Las propiedades y los valores predeterminados son los mismos que el sondeo de ejecución.

requestSettings

OnlineRequestSettings

Configuración de la solicitud para la implementación.

scaleSettings OnlineScaleSettings:

Configuración de escalado para la implementación. Si es null o no se proporciona, el valor predeterminado es TargetUtilizationScaleSettings para KubernetesOnlineDeployment y DefaultScaleSettings para ManagedOnlineDeployment.

startupProbe

ProbeSettings

El sondeo de inicio comprueba si una aplicación dentro de un contenedor se ha iniciado correctamente.

ManagedServiceIdentity

Identidad de servicio administrada (identidades asignadas por el sistema o asignadas por el usuario)

Nombre Tipo Description
principalId

string (uuid)

Identificador de entidad de servicio de la identidad asignada por el sistema. Esta propiedad solo se proporcionará para una identidad asignada por el sistema.

tenantId

string (uuid)

Identificador de inquilino de la identidad asignada por el sistema. Esta propiedad solo se proporcionará para una identidad asignada por el sistema.

type

ManagedServiceIdentityType

Tipo de identidad de servicio administrada (donde se permiten los tipos SystemAssigned y UserAssigned).

userAssignedIdentities

<string,  UserAssignedIdentity>

identidades de User-Assigned
Conjunto de identidades asignadas por el usuario asociadas al recurso. Las claves de diccionario userAssignedIdentities serán identificadores de recursos de ARM con el formato: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Los valores del diccionario pueden ser objetos vacíos ({}) en las solicitudes.

ManagedServiceIdentityType

Tipo de identidad de servicio administrada (donde se permiten los tipos SystemAssigned y UserAssigned).

Valor Description
None
SystemAssigned
UserAssigned
SystemAssigned,UserAssigned

OnlineDeployment

Los tipos de recursos de seguimiento concreto se pueden crear mediante el alias de este tipo mediante un tipo de propiedad específico.

Nombre Tipo Description
id

string

Identificador de recurso completo para el recurso. Ej: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Identidad de servicio administrada (identidades asignadas por el sistema o asignadas por el usuario)

kind

string

Metadatos usados por el portal, las herramientas, etc. para representar diferentes experiencias de experiencia de usuario para los recursos del mismo tipo.

location

string

Ubicación geográfica donde reside el recurso

name

string

Nombre del recurso.

properties OnlineDeploymentProperties:

[Obligatorio] Atributos adicionales de la entidad.

sku

Sku

Detalles de SKU necesarios para el contrato arm para el escalado automático.

systemData

systemData

Metadatos de Azure Resource Manager que contienen información createdBy y modifiedBy.

tags

object

Etiquetas de recursos.

type

string

Tipo de recurso. Por ejemplo, "Microsoft.Compute/virtualMachines" o "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

Una lista paginada de entidades OnlineDeployment.

Nombre Tipo Description
nextLink

string (uri)

El enlace a la siguiente página de artículos

value

OnlineDeployment[]

Los ítems de OnlineDeployment en esta página

OnlineRequestSettings

Configuración de solicitudes de puntuación de implementación en línea.

Nombre Tipo Valor predeterminado Description
maxConcurrentRequestsPerInstance

integer (int32)

1

Número de solicitudes simultáneas máximas por nodo permitidas por implementación. El valor predeterminado es 1.

maxQueueWait

string (duration)

PT0.5S

(en desuso para puntos de conexión en línea administrados) La cantidad máxima de tiempo que una solicitud permanecerá en la cola en formato ISO 8601. El valor predeterminado es 500 ms. (Ahora aumente para tener en request_timeout_ms cuenta los retrasos de redes o colas)

requestTimeout

string (duration)

PT5S

Tiempo de espera de puntuación en formato ISO 8601. El valor predeterminado es 5000 ms.

ProbeSettings

Configuración del sondeo de preparación y ejecución del contenedor de implementación.

Nombre Tipo Valor predeterminado Description
failureThreshold

integer (int32)

30

Número de errores que se deben permitir antes de devolver un estado incorrecto.

initialDelay

string (duration)

Retraso antes del primer sondeo en formato ISO 8601.

period

string (duration)

PT10S

El período de tiempo entre sondeos en formato ISO 8601.

successThreshold

integer (int32)

1

Número de sondeos correctos antes de devolver un estado correcto.

timeout

string (duration)

PT2S

Tiempo de espera del sondeo en formato ISO 8601.

RequestLogging

Nombre Tipo Description
captureHeaders

string[]

Para el registro de carga, solo recopilamos la carga de forma predeterminada. Si los clientes también quieren recopilar los encabezados especificados, pueden establecerlos en captureHeaders para que el back-end recopile esos encabezados junto con la carga útil.

RollingRateType

Cuando los datos del modelo se recopilan en Blob Storage, es necesario implementar los datos en una ruta de acceso diferente para evitar el registro de todos ellos en un solo archivo de blobs. Si la velocidad gradual es de hora, todos los datos se recopilarán en la ruta de acceso del blob /yyyy/MM/dd/HH/. Si es día, todos los datos se recopilarán en la ruta de acceso del blob /aaaa/MM/dd/. La otra ventaja de la ruta de acceso gradual es que la interfaz de usuario de supervisión de modelos puede seleccionar un intervalo de tiempo de datos muy rápidamente.

Valor Description
Year
Month
Day
Hour
Minute

ScaleType

Valor Description
Default
TargetUtilization

Sku

Definición del modelo de recursos que representa la SKU

Nombre Tipo Description
capacity

integer (int32)

Si la SKU admite el escalado horizontal o horizontal, se debe incluir el entero de capacidad. Si no es posible escalar horizontalmente o reducir horizontalmente el recurso, se puede omitir.

family

string

Si el servicio tiene diferentes generaciones de hardware, para la misma SKU, se puede capturar aquí.

name

string

Nombre de la SKU. Por ejemplo, P3. Normalmente es un código de letra y número

size

string

Tamaño de la SKU. Cuando el campo de nombre es la combinación de nivel y otro valor, este sería el código independiente.

tier

SkuTier

El proveedor de recursos necesita implementar este campo si el servicio tiene más de un nivel, pero no es necesario en put.

SkuTier

El proveedor de recursos necesita implementar este campo si el servicio tiene más de un nivel, pero no es necesario en put.

Valor Description
Free
Basic
Standard
Premium

systemData

Metadatos relativos a la creación y última modificación del recurso.

Nombre Tipo Description
createdAt

string (date-time)

Marca de tiempo de creación de recursos (UTC).

createdBy

string

Identidad que creó el recurso.

createdByType

createdByType

Tipo de identidad que creó el recurso.

lastModifiedAt

string (date-time)

Marca de tiempo de la última modificación del recurso (UTC)

lastModifiedBy

string

Identidad que modificó por última vez el recurso.

lastModifiedByType

createdByType

Tipo de identidad que modificó por última vez el recurso.

TargetUtilizationScaleSettings

Nombre Tipo Valor predeterminado Description
maxInstances

integer (int32)

1

Número máximo de instancias a las que la implementación se puede escalar. La cuota se reservará para max_instances.

minInstances

integer (int32)

1

El número mínimo de instancias que siempre se van a presentar.

pollingInterval

string (duration)

PT1S

Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos.

scaleType string:

TargetUtilization

[Obligatorio] Tipo de algoritmo de escalado de implementación

targetUtilizationPercentage

integer (int32)

70

Uso de CPU de destino para el escalador automático.

UserAssignedIdentity

Propiedades de identidad asignadas por el usuario

Nombre Tipo Description
clientId

string (uuid)

Identificador de cliente de la identidad asignada.

principalId

string (uuid)

Identificador de entidad de seguridad de la identidad asignada.