Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-02-01-preview

Artigo
01/13/2024

Definição de recurso do Bicep

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:

Grupos de recursos – veja comandos de implementação de grupos de recursos

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao seu modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    privateNetworkConnection: bool
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentDetails objects
  }
}

Objetos OnlineDeploymentDetails

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Para Gerido, utilize:

  endpointComputeType: 'Managed'

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  scaleType: 'Default'

Para TargetUtilization, utilize:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome	Descrição	Valor
name	O nome do recurso Veja como definir nomes e tipos para recursos subordinados no Bicep.	cadeia (obrigatório)
localização	A localização geográfica onde o recurso se encontra	cadeia (obrigatório)
etiquetas	Etiquetas de recursos.	Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku	Detalhes do SKU necessários para o contrato arm para dimensionamento automático.	SKU
tipo	Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo.	string
principal	No Bicep, pode especificar o recurso principal de um recurso subordinado. Só precisa de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal. Para obter mais informações, veja Recurso subordinado fora do recurso principal.	Nome simbólico para recurso do tipo: onlineEndpoints
identidade	Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador)	ManagedServiceIdentity
propriedades	[Obrigatório] Atributos adicionais da entidade.	OnlineDeploymentDetails (obrigatório)

ManagedServiceIdentity

Nome	Descrição	Valor
tipo	Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos).	"Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório)
userAssignedIdentities	O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos.	UserAssignedIdentities

UserAssignedIdentities

Nome	Descrição	Valor
{customized property}		UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentDetails

Nome	Descrição	Valor
appInsightsEnabled	Se for verdadeiro, ativa o registo do Application Insights.	bool
codeConfiguration	Configuração de código para a implementação do ponto final.	CodeConfiguration
descrição	Descrição da implementação do ponto final.	string
egressPublicNetworkAccess	Se Estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado.	"Desativado" "Ativado"
environmentId	ID de recurso do ARM da especificação do ambiente para a implementação do ponto final.	string
environmentVariables	Configuração de variáveis de ambiente para a implementação.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Tipo de instância de computação.	string
livenessProbe	A sonda liveness monitoriza regularmente o estado de funcionamento do contentor.	ProbeSettings
model	O caminho do URI para o modelo.	string
modelMountPath	O caminho para montar o modelo num contentor personalizado.	string
privateNetworkConnection	Se for verdadeiro, ative a ligação de rede privada. PRETERido para futuras versões da API. Utilize EgressPublicNetworkAccess.	bool
propriedades	Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas.	EndpointDeploymentPropertiesBaseProperties
readinessProbe	A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness.	ProbeSettings
requestSettings	Definições de pedido para a implementação.	OnlineRequestSettings
scaleSettings	Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Definir o tipo de objeto	Kubernetes Gerido (obrigatório)

CodeConfiguration

Nome	Descrição	Valor
codeId	ID do recurso arm do recurso de código.	string
scoreScript	[Obrigatório] O script a executar no arranque. Por exemplo, "score.py"	cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = `[a-zA-Z0-9_]`

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

ProbeSettings

Nome	Descrição	Valor
failureThreshold	O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento.	int
initialDelay	O atraso antes da primeira pesquisa no formato ISO 8601.	string
period	O período de tempo entre sondas no formato ISO 8601.	string
successThreshold	O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento.	int
tempo limite	O tempo limite da sonda no formato ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

OnlineRequestSettings

Nome	Descrição	Valor
maxConcurrentRequestsPerInstance	O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1.	int
maxQueueWait	A quantidade máxima de tempo que um pedido permanecerá na fila no formato ISO 8601. A predefinição é de 500ms.	string
requestTimeout	O tempo limite de classificação no formato ISO 8601. A predefinição é de 5000ms.	string

OnlineScaleSettings

Nome	Descrição	Valor
scaleType	Definir o tipo de objeto	Predefinição TargetUtilization (necessário)

DefaultScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"TargetUtilization" (obrigatório)
maxInstances	O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances.	int
minInstances	O número mínimo de instâncias a estar sempre presente.	int
pollingInterval	O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos.	string
targetUtilizationPercentage	Utilização da CPU de destino para o dimensionador automático.	int

KubernetesOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Kubernetes" (obrigatório)
containerResourceRequirements	Os requisitos de recursos para o contentor (cpu e memória).	ContainerResourceRequirements

ContainerResourceRequirements

Nome	Descrição	Valor
containerResourceLimits	Informações sobre o limite de recursos de contentor:	ContainerResourceSettings
containerResourceRequests	Informações do pedido de recurso de contentor:	ContainerResourceSettings

ContainerResourceSettings

Nome	Descrição	Valor
cpu	Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Número de cartões GPU Nvidia pedido/limite para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
Memória	Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Gerido" (obrigatório)

Sku

Nome	Descrição	Valor
capacidade	Se o SKU suportar o aumento horizontal/in, o número inteiro de capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente o recurso, tal poderá ser omitido.	int
família	Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui.	string
name	O nome do SKU. Ex - P3. Normalmente, é um código letter+number	cadeia (obrigatório)
size	O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo.	string
tier	Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT.	"Básico" 'Gratuito' "Premium" 'Standard'

Definição de recurso de modelo do ARM

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:

Grupos de recursos – veja comandos de implementação de grupos de recursos

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte JSON ao seu modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-02-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "privateNetworkConnection": "bool",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentDetails objects
  }
}

Objetos OnlineDeploymentDetails

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Para Gerido, utilize:

  "endpointComputeType": "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  "scaleType": "Default"

Para TargetUtilization, utilize:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome	Descrição	Valor
tipo	O tipo de recurso	"Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion	A versão da API de recursos	"2022-02-01-preview"
name	O nome do recurso Veja como definir nomes e tipos para recursos subordinados em modelos do ARM JSON.	cadeia (obrigatório)
localização	A localização geográfica onde o recurso se encontra	cadeia (obrigatório)
etiquetas	Etiquetas de recursos.	Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku	Detalhes do SKU necessários para o contrato arm para dimensionamento automático.	SKU
tipo	Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo.	string
identidade	Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador)	ManagedServiceIdentity
propriedades	[Obrigatório] Atributos adicionais da entidade.	OnlineDeploymentDetails (obrigatório)

ManagedServiceIdentity

Nome	Descrição	Valor
tipo	Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos).	"Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório)
userAssignedIdentities	O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos.	UserAssignedIdentities

UserAssignedIdentities

Nome	Descrição	Valor
{customized property}		UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentDetails

Nome	Descrição	Valor
appInsightsEnabled	Se for verdadeiro, ativa o registo do Application Insights.	bool
codeConfiguration	Configuração de código para a implementação do ponto final.	CodeConfiguration
descrição	Descrição da implementação do ponto final.	string
egressPublicNetworkAccess	Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado.	"Desativado" "Ativado"
environmentId	ID do recurso arm da especificação do ambiente para a implementação do ponto final.	string
environmentVariables	Configuração de variáveis de ambiente para a implementação.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Tipo de instância de computação.	string
livenessProbe	A sonda liveness monitoriza regularmente o estado de funcionamento do contentor.	ProbeSettings
model	O caminho do URI para o modelo.	string
modelMountPath	O caminho para montar o modelo num contentor personalizado.	string
privateNetworkConnection	Se for verdadeiro, ative a ligação de rede privada. PRETERIDO para futuras versões de API. Utilize EgressPublicNetworkAccess.	bool
propriedades	Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas.	EndpointDeploymentPropertiesBasePropriedades
readinessProbe	A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness.	ProbeSettings
requestSettings	Definições de pedido para a implementação.	OnlineRequestSettings
scaleSettings	Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Definir o tipo de objeto	Kubernetes Gerido (obrigatório)

CodeConfiguration

Nome	Descrição	Valor
codeId	ID do recurso arm do recurso de código.	string
scoreScript	[Obrigatório] O script a executar no arranque. Por exemplo, "score.py"	cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = `[a-zA-Z0-9_]`

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

ProbeSettings

Nome	Descrição	Valor
failureThreshold	O número de falhas a permitir antes de devolver um mau estado de funcionamento.	int
initialDelay	O atraso antes da primeira pesquisa no formato ISO 8601.	string
period	O período de tempo entre sondas no formato ISO 8601.	string
successThreshold	O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento.	int
tempo limite	O tempo limite da sonda no formato ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

OnlineRequestSettings

Nome	Descrição	Valor
maxConcurrentRequestsPerInstance	O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1.	int
maxQueueWait	A quantidade máxima de tempo que um pedido permanecerá na fila no formato ISO 8601. A predefinição é de 500ms.	string
requestTimeout	O tempo limite de classificação no formato ISO 8601. A predefinição é de 5000ms.	string

OnlineScaleSettings

Nome	Descrição	Valor
scaleType	Definir o tipo de objeto	Predefinição TargetUtilization (necessário)

DefaultScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"TargetUtilization" (obrigatório)
maxInstances	O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances.	int
minInstances	O número mínimo de instâncias a estar sempre presente.	int
pollingInterval	O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos.	string
targetUtilizationPercentage	Utilização da CPU de destino para o dimensionador automático.	int

KubernetesOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Kubernetes" (obrigatório)
containerResourceRequirements	Os requisitos de recursos para o contentor (cpu e memória).	ContainerResourceRequirements

ContainerResourceRequirements

Nome	Descrição	Valor
containerResourceLimits	Informações sobre o limite de recursos de contentor:	ContainerResourceSettings
containerResourceRequests	Informações do pedido de recurso de contentor:	ContainerResourceSettings

ContainerResourceSettings

Nome	Descrição	Valor
cpu	Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Número de cartões GPU Nvidia pedido/limite para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
Memória	Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Gerido" (obrigatório)

Sku

Nome	Descrição	Valor
capacidade	Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido.	int
família	Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui.	string
name	O nome do SKU. Ex - P3. Normalmente, é um código letter+number	cadeia (obrigatório)
size	O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo.	string
tier	Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT.	"Básico" 'Gratuito' "Premium" 'Standard'

Definição de recurso terraform (fornecedor AzAPI)

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:

Grupos de recursos

Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Terraform ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      privateNetworkConnection = bool
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentDetails objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objetos OnlineDeploymentDetails

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para o Kubernetes, utilize:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Para Gerido, utilize:

  endpointComputeType = "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Predefinição, utilize:

  scaleType = "Default"

Para TargetUtilization, utilize:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome	Descrição	Valor
tipo	O tipo de recurso	"Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview"
name	O nome do recurso	cadeia (obrigatório)
localização	A localização geográfica onde reside o recurso	cadeia (obrigatório)
parent_id	O ID do recurso que é o principal para este recurso.	ID do recurso do tipo: onlineEndpoints
etiquetas	Etiquetas de recursos.	Dicionário de nomes e valores de etiquetas.
sku	Detalhes do SKU necessários para o contrato arm para dimensionamento automático.	SKU
tipo	Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo.	string
identidade	Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador)	ManagedServiceIdentity
propriedades	[Obrigatório] Atributos adicionais da entidade.	OnlineDeploymentDetails (obrigatório)

ManagedServiceIdentity

Nome	Descrição	Valor
tipo	Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos).	"SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório)
identity_ids	O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos.	Matriz de IDs de identidade do utilizador.

UserAssignedIdentities

Nome	Descrição	Valor
{customized property}		UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

OnlineDeploymentDetails

Nome	Descrição	Valor
appInsightsEnabled	Se for verdadeiro, ativa o registo do Application Insights.	bool
codeConfiguration	Configuração de código para a implementação do ponto final.	CodeConfiguration
descrição	Descrição da implementação do ponto final.	string
egressPublicNetworkAccess	Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado.	"Desativado" "Ativado"
environmentId	ID do recurso arm da especificação do ambiente para a implementação do ponto final.	string
environmentVariables	Configuração de variáveis de ambiente para a implementação.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Tipo de instância de computação.	string
livenessProbe	A sonda liveness monitoriza regularmente o estado de funcionamento do contentor.	ProbeSettings
model	O caminho do URI para o modelo.	string
modelMountPath	O caminho para montar o modelo num contentor personalizado.	string
privateNetworkConnection	Se for verdadeiro, ative a ligação de rede privada. PRETERIDO para futuras versões de API. Utilize EgressPublicNetworkAccess.	bool
propriedades	Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas.	EndpointDeploymentPropertiesBasePropriedades
readinessProbe	A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness.	ProbeSettings
requestSettings	Definições de pedido para a implementação.	OnlineRequestSettings
scaleSettings	Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Definir o tipo de objeto	Kubernetes Gerido (obrigatório)

CodeConfiguration

Nome	Descrição	Valor
codeId	ID do recurso arm do recurso de código.	string
scoreScript	[Obrigatório] O script a executar no arranque. Por exemplo, "score.py"	cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = `[a-zA-Z0-9_]`

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

ProbeSettings

Nome	Descrição	Valor
failureThreshold	O número de falhas a permitir antes de devolver um mau estado de funcionamento.	int
initialDelay	O atraso antes da primeira pesquisa no formato ISO 8601.	string
period	O período de tempo entre sondas no formato ISO 8601.	string
successThreshold	O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento.	int
tempo limite	O tempo limite da sonda no formato ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nome	Descrição	Valor
{customized property}		string
{customized property}		string

OnlineRequestSettings

Nome	Descrição	Valor
maxConcurrentRequestsPerInstance	O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1.	int
maxQueueWait	A quantidade máxima de tempo que um pedido permanecerá na fila no formato ISO 8601. A predefinição é de 500ms.	string
requestTimeout	O tempo limite de classificação no formato ISO 8601. A predefinição é de 5000ms.	string

OnlineScaleSettings

Nome	Descrição	Valor
scaleType	Definir o tipo de objeto	Predefinição TargetUtilization (necessário)

DefaultScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"Predefinição" (obrigatório)

TargetUtilizationScaleSettings

Nome	Descrição	Valor
scaleType	[Obrigatório] Tipo de algoritmo de dimensionamento de implementação	"TargetUtilization" (necessário)
maxInstances	O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances.	int
minInstances	O número mínimo de instâncias a estar sempre presente.	int
pollingInterval	O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos.	string
targetUtilizationPercentage	Utilização da CPU de destino para o dimensionador automático.	int

KubernetesOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Kubernetes" (obrigatório)
containerResourceRequirements	Os requisitos de recursos para o contentor (cpu e memória).	ContainerResourceRequirements

ContainerResourceRequirements

Nome	Descrição	Valor
containerResourceLimits	Informações sobre o limite de recursos de contentor:	ContainerResourceSettings
containerResourceRequests	Informações do pedido de recurso de contentor:	ContainerResourceSettings

ContainerResourceSettings

Nome	Descrição	Valor
cpu	Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Número de cartões GPU Nvidia pedido/limite para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
Memória	Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nome	Descrição	Valor
endpointComputeType	[Obrigatório] O tipo de computação do ponto final.	"Gerido" (obrigatório)

Sku

Nome	Descrição	Valor
capacidade	Se o SKU suportar o aumento horizontal/in, o número inteiro de capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente o recurso, tal poderá ser omitido.	int
família	Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui.	string
name	O nome do SKU. Ex - P3. Normalmente, é um código letter+number	cadeia (obrigatório)
size	O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo.	string
tier	Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT.	"Básico" "Gratuito" "Premium" "Standard"

Partilhar via

Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-02-01-preview

Definição de recurso do Bicep

Formato do recurso

Objetos OnlineDeploymentDetails

Objetos OnlineScaleSettings

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

ManagedServiceIdentity

UserAssignedIdentities

UserAssignedIdentity

OnlineDeploymentDetails

CodeConfiguration

EndpointDeploymentPropertiesBaseEnvironmentVariables

ProbeSettings

EndpointDeploymentPropertiesBaseProperties

OnlineRequestSettings

OnlineScaleSettings

DefaultScaleSettings

TargetUtilizationScaleSettings

KubernetesOnlineDeployment

ContainerResourceRequirements

ContainerResourceSettings

ManagedOnlineDeployment

Sku

Definição de recurso de modelo do ARM

Formato do recurso

Objetos OnlineDeploymentDetails

Objetos OnlineScaleSettings

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

ManagedServiceIdentity

UserAssignedIdentities

UserAssignedIdentity

OnlineDeploymentDetails

CodeConfiguration

EndpointDeploymentPropertiesBaseEnvironmentVariables

ProbeSettings

EndpointDeploymentPropertiesBaseProperties

OnlineRequestSettings

OnlineScaleSettings

DefaultScaleSettings

TargetUtilizationScaleSettings

KubernetesOnlineDeployment

ContainerResourceRequirements

ContainerResourceSettings

ManagedOnlineDeployment

Sku

Definição de recurso terraform (fornecedor AzAPI)

Formato do recurso

Objetos OnlineDeploymentDetails

Objetos OnlineScaleSettings

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

ManagedServiceIdentity

UserAssignedIdentities

UserAssignedIdentity

OnlineDeploymentDetails

CodeConfiguration

EndpointDeploymentPropertiesBaseEnvironmentVariables

ProbeSettings

EndpointDeploymentPropertiesBaseProperties

OnlineRequestSettings

OnlineScaleSettings

DefaultScaleSettings

TargetUtilizationScaleSettings

KubernetesOnlineDeployment

ContainerResourceRequirements

ContainerResourceSettings

ManagedOnlineDeployment

Sku

Comentários

Comentários

Recursos adicionais