Partilhar via


Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-10-01-preview

Definição de recurso do Bicep

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:

Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao seu modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Para Gerido, utilize:

  endpointComputeType: 'Managed'

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  scaleType: 'Default'

Para TargetUtilization, utilize:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados no Bicep.
cadeia (obrigatório)
localização A localização geográfica onde reside o recurso cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
principal No Bicep, pode especificar o recurso principal de um recurso subordinado. Só tem de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal.

Para obter mais informações, veja Recurso subordinado fora do recurso principal.
Nome simbólico para recurso do tipo: onlineEndpoints
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
egressPublicNetworkAccess Se Estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. "Desativado"
"Ativado"
environmentId ID de recurso do ARM da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
model O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo num contentor personalizado. string
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
requestSettings Definições de pedido para a implementação. OnlineRequestSettings
scaleSettings Definições de dimensionamento para a implementação.
Se for nulo ou não for fornecido,
a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{customized property} string
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor
{customized property} string
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1. int
maxQueueWait A quantidade máxima de tempo que um pedido permanecerá na fila no formato ISO 8601.
A predefinição é de 500ms.
string
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é de 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Predefinição
TargetUtilization (necessário)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "TargetUtilization" (obrigatório)
maxInstances O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. int
minInstances O número mínimo de instâncias a estar sempre presente. int
pollingInterval O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Kubernetes" (obrigatório)
containerResourceRequirements Os requisitos de recursos para o contentor (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações sobre o limite de recursos de contentor: ContainerResourceSettings
containerResourceRequests Informações do pedido de recurso de contentor: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de pedidos/limite de vCPUs para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de cartões GPU Nvidia pedido/limite para contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Memória Pedido/limite de tamanho da memória para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento horizontal/in, o número inteiro de capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
'Gratuito'
"Premium"
'Standard'

Definição de recurso de modelo do ARM

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte JSON ao seu modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-10-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Para Gerido, utilize:

  "endpointComputeType": "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  "scaleType": "Default"

Para TargetUtilization, utilize:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion A versão da API de recursos "2022-10-01-preview"
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados em modelos do ARM JSON.
cadeia (obrigatório)
localização A localização geográfica onde o recurso se encontra cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
egressPublicNetworkAccess Se Estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. "Desativado"
"Ativado"
environmentId ID de recurso do ARM da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
model O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo num contentor personalizado. string
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
requestSettings Definições de pedido para a implementação. OnlineRequestSettings
scaleSettings Definições de dimensionamento para a implementação.
Se for nulo ou não for fornecido,
a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{customized property} string
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor
{customized property} string
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitidos por implementação. A predefinição é 1. int
maxQueueWait O período máximo de tempo durante o qual um pedido permanecerá na fila no formato ISO 8601.
A predefinição é 500ms.
string
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Predefinição
TargetUtilization (obrigatório)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "TargetUtilization" (obrigatório)
maxInstances O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. int
minInstances O número mínimo de instâncias a estar sempre presente. int
pollingInterval O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Kubernetes" (obrigatório)
containerResourceRequirements Os requisitos de recursos para o contentor (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contentor: ContainerResourceSettings
containerResourceRequests Informações do pedido de recurso de contentor: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de pedidos/limite de vCPUs para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de pedidos/limite de cartões GPU Nvidia para contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Memória Pedido/limite de tamanho da memória para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
'Gratuito'
"Premium"
'Standard'

Definição de recurso terraform (fornecedor AzAPI)

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:

  • Grupos de recursos

Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Terraform ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Para Gerido, utilize:

  endpointComputeType = "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  scaleType = "Default"

Para TargetUtilization, utilize:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01-preview"
name O nome do recurso cadeia (obrigatório)
localização A localização geográfica onde reside o recurso cadeia (obrigatório)
parent_id O ID do recurso que é o principal para este recurso. ID do recurso do tipo: onlineEndpoints
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas.
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
identity_ids O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. Matriz de IDs de identidade do utilizador.

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
egressPublicNetworkAccess Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. "Desativado"
"Ativado"
environmentId ID do recurso arm da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
model O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo num contentor personalizado. string
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBasePropriedades
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
requestSettings Definições de pedido para a implementação. OnlineRequestSettings
scaleSettings Definições de dimensionamento para a implementação.
Se for nulo ou não for fornecido,
a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{customized property} string
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

EndpointDeploymentPropertiesBasePropriedades

Nome Descrição Valor
{customized property} string
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitidos por implementação. A predefinição é 1. int
maxQueueWait O período máximo de tempo durante o qual um pedido permanecerá na fila no formato ISO 8601.
A predefinição é 500ms.
string
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Predefinição
TargetUtilization (obrigatório)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "TargetUtilization" (obrigatório)
maxInstances O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. int
minInstances O número mínimo de instâncias a estar sempre presente. int
pollingInterval O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Kubernetes" (obrigatório)
containerResourceRequirements Os requisitos de recursos para o contentor (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contentor: ContainerResourceSettings
containerResourceRequests Informações do pedido de recurso de contentor: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de pedidos/limite de vCPUs para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de pedidos/limite de cartões GPU Nvidia para contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Memória Pedido/limite de tamanho da memória para o contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
"Gratuito"
"Premium"
"Standard"