Compartir a través de


Áreas de trabajo de Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview

Definición de recursos de Bicep

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente bicep a la plantilla.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
  tags: {
    {customized property}: 'string'
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  pollingInterval: 'string'
  scaleType: 'Auto'
  targetUtilizationPercentage: int
}

Para Manual, use:

{
  instanceCount: int
  scaleType: 'Manual'
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }
  endpointComputeType: 'K8S'
}

Para Administrado, use:

{
  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  datastoreId: 'string'
  path: 'string'
  referenceType: 'DataPath'
}

Para Id, use:

{
  assetId: 'string'
  referenceType: 'Id'
}

Para OutputPath, use:

{
  jobId: 'string'
  path: 'string'
  referenceType: 'OutputPath'
}

Valores de propiedad

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Importancia
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal, las herramientas, etc. para representar diferentes experiencias de experiencia de usuario para los recursos del mismo tipo. cuerda / cadena
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
padre En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario.

Para obtener más información, consulte Recurso secundario fuera del recurso primario.
Nombre simbólico del recurso de tipo: workspaces/onlineEndpoints
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas de recursos Diccionario de nombres y valores de etiqueta. Consulte Etiquetas en plantillas.

AssetReferenceBase

Nombre Descripción Importancia
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'Ruta de datos'
'Ídem'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Importancia
intervalo de sondeo Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda / cadena
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Importancia
codeId Identificador de recurso de ARM del recurso de código. cuerda / cadena
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

RequisitosDeRecursosDelContenedor

Nombre Descripción Importancia
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
GPU (unidad de procesamiento gráfico) Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Importancia
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda / cadena
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Importancia
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Importancia
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Importancia
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda / cadena
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Importancia
InstanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Implementación en línea

Nombre Descripción Importancia
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda / cadena
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Managed" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda / cadena
variables de entorno Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Importancia

OnlineDeploymentProperties

Nombre Descripción Importancia

OnlineRequestSettings

Nombre Descripción Importancia
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena

OnlineScaleSettings

Nombre Descripción Importancia
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Importancia
jobId Identificador de recurso de ARM del trabajo. cuerda / cadena
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

Configuración de la sonda

Nombre Descripción Importancia
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda / cadena
período El período de tiempo entre sondeos en formato ISO 8601. cuerda / cadena
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
tiempo de expiración Tiempo de espera del sondeo en formato ISO 8601. cuerda / cadena

ResourceIdentity (Identidad de recurso)

Nombre Descripción Importancia
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'Asignado por el usuario'
identidades asignadas por el usuario Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Importancia

TrackedResourceTags

Nombre Descripción Importancia

UserAssignedIdentityMeta

Nombre Descripción Importancia
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda / cadena
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda / cadena

Definición de recursos de plantilla de ARM

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente JSON a la plantilla.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  },
  "tags": {
    "{customized property}": "string"
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  "pollingInterval": "string",
  "scaleType": "Auto",
  "targetUtilizationPercentage": "int"
}

Para Manual, use:

{
  "instanceCount": "int",
  "scaleType": "Manual"
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  },
  "endpointComputeType": "K8S"
}

Para Administrado, use:

{
  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  "datastoreId": "string",
  "path": "string",
  "referenceType": "DataPath"
}

Para Id, use:

{
  "assetId": "string",
  "referenceType": "Id"
}

Para OutputPath, use:

{
  "jobId": "string",
  "path": "string",
  "referenceType": "OutputPath"
}

Valores de propiedad

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Importancia
apiVersion La versión de api '2021-03-01-preestreno'
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal, las herramientas, etc. para representar diferentes experiencias de experiencia de usuario para los recursos del mismo tipo. cuerda / cadena
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas de recursos Diccionario de nombres y valores de etiqueta. Consulte Etiquetas en plantillas.
tipo El tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

AssetReferenceBase

Nombre Descripción Importancia
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'Ruta de datos'
'Ídem'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Importancia
intervalo de sondeo Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda / cadena
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Importancia
codeId Identificador de recurso de ARM del recurso de código. cuerda / cadena
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

RequisitosDeRecursosDelContenedor

Nombre Descripción Importancia
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
GPU (unidad de procesamiento gráfico) Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Importancia
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda / cadena
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Importancia
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Importancia
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Importancia
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda / cadena
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Importancia
InstanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Implementación en línea

Nombre Descripción Importancia
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda / cadena
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Managed" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda / cadena
variables de entorno Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Importancia

OnlineDeploymentProperties

Nombre Descripción Importancia

OnlineRequestSettings

Nombre Descripción Importancia
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena

OnlineScaleSettings

Nombre Descripción Importancia
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Importancia
jobId Identificador de recurso de ARM del trabajo. cuerda / cadena
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

Configuración de la sonda

Nombre Descripción Importancia
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda / cadena
período El período de tiempo entre sondeos en formato ISO 8601. cuerda / cadena
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
tiempo de expiración Tiempo de espera del sondeo en formato ISO 8601. cuerda / cadena

ResourceIdentity (Identidad de recurso)

Nombre Descripción Importancia
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'Asignado por el usuario'
identidades asignadas por el usuario Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Importancia

TrackedResourceTags

Nombre Descripción Importancia

UserAssignedIdentityMeta

Nombre Descripción Importancia
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda / cadena
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda / cadena

Ejemplos de uso

Definición de recursos de Terraform (proveedor AzAPI)

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

  • grupos de recursos de

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente terraform a la plantilla.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  parent_id = "string"
  identity {
    type = "string"
    identity_ids = [
      "string"
    ]
  }
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = {
    kind = "string"
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  pollingInterval = "string"
  scaleType = "Auto"
  targetUtilizationPercentage = int
}

Para Manual, use:

{
  instanceCount = int
  scaleType = "Manual"
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }
  endpointComputeType = "K8S"
}

Para Administrado, use:

{
  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  datastoreId = "string"
  path = "string"
  referenceType = "DataPath"
}

Para Id, use:

{
  assetId = "string"
  referenceType = "Id"
}

Para OutputPath, use:

{
  jobId = "string"
  path = "string"
  referenceType = "OutputPath"
}

Valores de propiedad

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Importancia
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal, las herramientas, etc. para representar diferentes experiencias de experiencia de usuario para los recursos del mismo tipo. cuerda / cadena
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
parent_id Identificador del recurso que es el elemento primario de este recurso. Identificador del recurso de tipo: workspaces/onlineEndpoints
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas de recursos Diccionario de nombres y valores de etiqueta.
tipo El tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"

AssetReferenceBase

Nombre Descripción Importancia
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'Ruta de datos'
'Ídem'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Importancia
intervalo de sondeo Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda / cadena
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Importancia
codeId Identificador de recurso de ARM del recurso de código. cuerda / cadena
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

RequisitosDeRecursosDelContenedor

Nombre Descripción Importancia
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
GPU (unidad de procesamiento gráfico) Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Importancia
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda / cadena
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Importancia
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Importancia
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Importancia
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda / cadena
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Importancia
InstanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Implementación en línea

Nombre Descripción Importancia
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda / cadena
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Managed" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda / cadena
variables de entorno Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Importancia

OnlineDeploymentProperties

Nombre Descripción Importancia

OnlineRequestSettings

Nombre Descripción Importancia
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda / cadena

OnlineScaleSettings

Nombre Descripción Importancia
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Importancia
jobId Identificador de recurso de ARM del trabajo. cuerda / cadena
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda / cadena
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

Configuración de la sonda

Nombre Descripción Importancia
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda / cadena
período El período de tiempo entre sondeos en formato ISO 8601. cuerda / cadena
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
tiempo de expiración Tiempo de espera del sondeo en formato ISO 8601. cuerda / cadena

ResourceIdentity (Identidad de recurso)

Nombre Descripción Importancia
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'Asignado por el usuario'
identidades asignadas por el usuario Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Importancia

TrackedResourceTags

Nombre Descripción Importancia

UserAssignedIdentityMeta

Nombre Descripción Importancia
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda / cadena
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda / cadena