Partilhar via


Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview

Definição de recurso do Bicep

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:

Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao seu modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
}

Objetos OnlineDeployment

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para K8S, utilize:

  endpointComputeType: 'K8S'
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }

Para Gerido, utilize:

  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }

Objetos AssetReferenceBase

Defina a propriedade referenceType para especificar o tipo de objeto.

Para DataPath, utilize:

  referenceType: 'DataPath'
  datastoreId: 'string'
  path: 'string'

Para O ID, utilize:

  referenceType: 'Id'
  assetId: 'string'

Para OutputPath, utilize:

  referenceType: 'OutputPath'
  jobId: 'string'
  path: 'string'

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Automático, utilize:

  scaleType: 'Auto'
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Para Manual, utilize:

  scaleType: 'Manual'
  instanceCount: int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados no Bicep.
cadeia (obrigatório)
localização A localização geográfica onde reside o recurso cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
principal No Bicep, pode especificar o recurso principal de um recurso subordinado. Só tem de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal.

Para obter mais informações, veja Recurso subordinado fora do recurso principal.
Nome simbólico para recurso do tipo: onlineEndpoints
identidade Identidade de serviço associada a um recurso. ResourceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeployment (obrigatório)

ResourceIdentity

Nome Descrição Valor
tipo Define valores para o tipo de ResourceIdentity. "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrição Valor
clientId Também conhecido como ID da aplicação, um identificador exclusivo gerado por Azure AD que está associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. string
principalId O ID de objeto do objeto do principal de serviço para a identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. string

OnlineDeployment

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
environmentId ID do recurso arm da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. OnlineDeploymentEnvironmentVariables
livenessProbe Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. ProbeSettings
model Referência ao recurso de modelo para a implementação do ponto final. AssetReferenceBase
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. OnlineDeploymentProperties
requestSettings Configuração de pedidos de classificação de implementação online. OnlineRequestSettings
scaleSettings Configuração do dimensionamento da implementação online. OnlineScaleSettings
endpointComputeType Definir o tipo de objeto K8S
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

AssetReferenceBase

Nome Descrição Valor
referenceType Definir o tipo de objeto DataPath
ID
OutputPath (obrigatório)

DataPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "DataPath" (obrigatório)
datastoreId ID de recurso arm do arquivo de dados onde o recurso está localizado. string
caminho O caminho do ficheiro/diretório no arquivo de dados. string

IdAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "ID" (obrigatório)
assetId [Obrigatório] ID do recurso arm do recurso. cadeia (obrigatório)

Restrições:
Padrão = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "OutputPath" (obrigatório)
jobId ID de recurso do ARM da tarefa. string
caminho O caminho do ficheiro/diretório na saída da tarefa. string

OnlineDeploymentProperties

Nome Descrição Valor
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número de pedidos permitidos em fila de uma só vez para esta implementação. int
maxQueueWait O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. string
requestTimeout O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. string

OnlineScaleSettings

Nome Descrição Valor
maxInstances Número máximo de instâncias para esta implementação. int
minInstances Número mínimo de instâncias para esta implementação. int
scaleType Definir o tipo de objeto Automático
Manual (obrigatório)

Dimensionamento AutomáticoDefinições

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Automático" (obrigatório)
pollingInterval O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

ManualScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Manual" (obrigatório)
instanceCount Número fixo de instâncias para esta implementação. int

K8SOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "K8S" (obrigatório)
containerResourceRequirements Requisitos de recursos para cada instância de contentor numa implementação online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
cpu A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
fpga O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. int
gpu O número de núcleos gpu no contentor. int
memoryInGB A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)
instanceType Tipo de instância de computação. string
readinessProbe Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. ProbeSettings

Definição de recurso de modelo do ARM

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte JSON ao seu modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  }
}

Objetos OnlineDeployment

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para K8S, utilize:

  "endpointComputeType": "K8S",
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  }

Para Gerido, utilize:

  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }

Objetos AssetReferenceBase

Defina a propriedade referenceType para especificar o tipo de objeto.

Para DataPath, utilize:

  "referenceType": "DataPath",
  "datastoreId": "string",
  "path": "string"

Para O ID, utilize:

  "referenceType": "Id",
  "assetId": "string"

Para OutputPath, utilize:

  "referenceType": "OutputPath",
  "jobId": "string",
  "path": "string"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Automático, utilize:

  "scaleType": "Auto",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Para Manual, utilize:

  "scaleType": "Manual",
  "instanceCount": "int"

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion A versão da API de recursos '2021-03-01-preview'
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados em modelos do ARM JSON.
cadeia (obrigatório)
localização A localização geográfica onde o recurso se encontra cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço associada a um recurso. ResourceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeployment (obrigatório)

ResourceIdentity

Nome Descrição Valor
tipo Define valores para o tipo resourceIdentity. "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrição Valor
clientId Também conhecido como ID da aplicação, um identificador exclusivo gerado pelo Azure AD associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. string
principalId O ID do objeto do principal de serviço para a sua identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. string

OnlineDeployment

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
environmentId ID de recurso do ARM da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. OnlineDeploymentEnvironmentVariables
livenessProbe Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. ProbeSettings
model Referência ao recurso de modelo para a implementação do ponto final. AssetReferenceBase
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. OnlineDeploymentProperties
requestSettings Configuração de pedidos de classificação de implementação online. OnlineRequestSettings
scaleSettings Configuração de dimensionamento de implementação online. OnlineScaleSettings
endpointComputeType Definir o tipo de objeto K8S
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

AssetReferenceBase

Nome Descrição Valor
referenceType Definir o tipo de objeto DataPath
ID
OutputPath (obrigatório)

DataPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "DataPath" (obrigatório)
datastoreId ID do recurso arm do arquivo de dados onde o recurso está localizado. string
caminho O caminho do ficheiro/diretório no arquivo de dados. string

IdAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "ID" (obrigatório)
assetId [Obrigatório] ID do recurso arm do recurso. cadeia (obrigatório)

Restrições:
Padrão = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "OutputPath" (obrigatório)
jobId ID de recurso do ARM da tarefa. string
caminho O caminho do ficheiro/diretório na saída da tarefa. string

OnlineDeploymentProperties

Nome Descrição Valor
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número de pedidos permitidos em fila de uma só vez para esta implementação. int
maxQueueWait O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. string
requestTimeout O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. string

OnlineScaleSettings

Nome Descrição Valor
maxInstances Número máximo de instâncias para esta implementação. int
minInstances Número mínimo de instâncias para esta implementação. int
scaleType Definir o tipo de objeto Automático
Manual (obrigatório)

Dimensionamento AutomáticoDefinições

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Automático" (obrigatório)
pollingInterval O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

ManualScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Manual" (obrigatório)
instanceCount Número fixo de instâncias para esta implementação. int

K8SOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "K8S" (obrigatório)
containerResourceRequirements Requisitos de recursos para cada instância de contentor numa implementação online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
cpu A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
fpga O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. int
gpu O número de núcleos de GPU no contentor. int
memoryInGB A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)
instanceType Tipo de instância de computação. string
readinessProbe Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. ProbeSettings

Definição de recurso terraform (fornecedor AzAPI)

O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:

  • Grupos de recursos

Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Terraform ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
    kind = "string"
  })
}

Objetos OnlineDeployment

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para K8S, utilize:

  endpointComputeType = "K8S"
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }

Para Gerido, utilize:

  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }

Objetos AssetReferenceBase

Defina a propriedade referenceType para especificar o tipo de objeto.

Para DataPath, utilize:

  referenceType = "DataPath"
  datastoreId = "string"
  path = "string"

Para O ID, utilize:

  referenceType = "Id"
  assetId = "string"

Para OutputPath, utilize:

  referenceType = "OutputPath"
  jobId = "string"
  path = "string"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Automático, utilize:

  scaleType = "Auto"
  pollingInterval = "string"
  targetUtilizationPercentage = int

Para Manual, utilize:

  scaleType = "Manual"
  instanceCount = int

Valores de propriedade

áreas de trabalho/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name O nome do recurso cadeia (obrigatório)
localização A localização geográfica onde reside o recurso cadeia (obrigatório)
parent_id O ID do recurso que é o principal para este recurso. ID do recurso do tipo: onlineEndpoints
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas.
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço associada a um recurso. ResourceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeployment (obrigatório)

ResourceIdentity

Nome Descrição Valor
tipo Define valores para o tipo de ResourceIdentity. "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
identity_ids Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. Matriz de IDs de identidade do utilizador.

ResourceIdentityUserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrição Valor
clientId Também conhecido como ID da aplicação, um identificador exclusivo gerado por Azure AD que está associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. string
principalId O ID de objeto do objeto do principal de serviço para a identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. string

OnlineDeployment

Nome Descrição Valor
appInsightsEnabled Se for verdadeiro, ativa o registo do Application Insights. bool
codeConfiguration Configuração de código para a implementação do ponto final. CodeConfiguration
descrição Descrição da implementação do ponto final. string
environmentId ID do recurso arm da especificação do ambiente para a implementação do ponto final. string
environmentVariables Configuração de variáveis de ambiente para a implementação. OnlineDeploymentEnvironmentVariables
livenessProbe Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. ProbeSettings
model Referência ao recurso de modelo para a implementação do ponto final. AssetReferenceBase
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. OnlineDeploymentProperties
requestSettings Configuração de pedidos de classificação de implementação online. OnlineRequestSettings
scaleSettings Configuração do dimensionamento da implementação online. OnlineScaleSettings
endpointComputeType Definir o tipo de objeto K8S
Gerido (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

AssetReferenceBase

Nome Descrição Valor
referenceType Definir o tipo de objeto DataPath
ID
OutputPath (obrigatório)

DataPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "DataPath" (obrigatório)
datastoreId ID de recurso arm do arquivo de dados onde o recurso está localizado. string
caminho O caminho do ficheiro/diretório no arquivo de dados. string

IdAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "ID" (obrigatório)
assetId [Obrigatório] ID do recurso arm do recurso. cadeia (obrigatório)

Restrições:
Padrão = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrição Valor
referenceType [Obrigatório] Especifica o tipo de referência de recursos. "OutputPath" (obrigatório)
jobId ID do recurso arm da tarefa. string
caminho O caminho do ficheiro/diretório na saída da tarefa. string

OnlineDeploymentProperties

Nome Descrição Valor
{customized property} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número de pedidos permitidos em fila ao mesmo tempo para esta implementação. int
maxQueueWait O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. string
requestTimeout O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. string

OnlineScaleSettings

Nome Descrição Valor
maxInstances Número máximo de instâncias para esta implementação. int
minInstances Número mínimo de instâncias para esta implementação. int
scaleType Definir o tipo de objeto Automático
Manual (obrigatório)

Dimensionamento AutomáticoDefinições

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Automático" (obrigatório)
pollingInterval O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. string
targetUtilizationPercentage Utilização da CPU de destino para o dimensionador automático. int

ManualScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implementação "Manual" (obrigatório)
instanceCount Número fixo de instâncias para esta implementação. int

K8SOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "K8S" (obrigatório)
containerResourceRequirements Requisitos de recursos para cada instância de contentor numa implementação online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
cpu A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
fpga O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. int
gpu O número de núcleos gpu no contentor. int
memoryInGB A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto final. "Gerido" (obrigatório)
instanceType Tipo de instância de computação. string
readinessProbe Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. ProbeSettings