Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview
Definição de recurso do Bicep
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:
- Grupos de recursos – veja os comandos de implementação do grupo de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao seu modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
Objetos OnlineDeployment
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para K8S, utilize:
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
Para Gerido, utilize:
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
Objetos AssetReferenceBase
Defina a propriedade referenceType para especificar o tipo de objeto.
Para DataPath, utilize:
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
Para O ID, utilize:
referenceType: 'Id'
assetId: 'string'
Para OutputPath, utilize:
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Automático, utilize:
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
Para Manual, utilize:
scaleType: 'Manual'
instanceCount: int
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
name | O nome do recurso Veja como definir nomes e tipos para recursos subordinados no Bicep. |
cadeia (obrigatório) |
localização | A localização geográfica onde reside o recurso | cadeia (obrigatório) |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
principal | No Bicep, pode especificar o recurso principal de um recurso subordinado. Só tem de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal. Para obter mais informações, veja Recurso subordinado fora do recurso principal. |
Nome simbólico para recurso do tipo: onlineEndpoints |
identidade | Identidade de serviço associada a um recurso. | ResourceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeployment (obrigatório) |
ResourceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Define valores para o tipo de ResourceIdentity. | "Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrição | Valor |
---|---|---|
clientId | Também conhecido como ID da aplicação, um identificador exclusivo gerado por Azure AD que está associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. | string |
principalId | O ID de objeto do objeto do principal de serviço para a identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. | string |
OnlineDeployment
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
environmentId | ID do recurso arm da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. | ProbeSettings |
model | Referência ao recurso de modelo para a implementação do ponto final. | AssetReferenceBase |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | OnlineDeploymentProperties |
requestSettings | Configuração de pedidos de classificação de implementação online. | OnlineRequestSettings |
scaleSettings | Configuração do dimensionamento da implementação online. | OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | K8S Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
AssetReferenceBase
Nome | Descrição | Valor |
---|---|---|
referenceType | Definir o tipo de objeto | DataPath ID OutputPath (obrigatório) |
DataPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "DataPath" (obrigatório) |
datastoreId | ID de recurso arm do arquivo de dados onde o recurso está localizado. | string |
caminho | O caminho do ficheiro/diretório no arquivo de dados. | string |
IdAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "ID" (obrigatório) |
assetId | [Obrigatório] ID do recurso arm do recurso. | cadeia (obrigatório) Restrições: Padrão = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "OutputPath" (obrigatório) |
jobId | ID de recurso do ARM da tarefa. | string |
caminho | O caminho do ficheiro/diretório na saída da tarefa. | string |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número de pedidos permitidos em fila de uma só vez para esta implementação. | int |
maxQueueWait | O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. | string |
requestTimeout | O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. | string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | Número máximo de instâncias para esta implementação. | int |
minInstances | Número mínimo de instâncias para esta implementação. | int |
scaleType | Definir o tipo de objeto | Automático Manual (obrigatório) |
Dimensionamento AutomáticoDefinições
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Automático" (obrigatório) |
pollingInterval | O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
ManualScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Manual" (obrigatório) |
instanceCount | Número fixo de instâncias para esta implementação. | int |
K8SOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "K8S" (obrigatório) |
containerResourceRequirements | Requisitos de recursos para cada instância de contentor numa implementação online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
cpu | A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. | int |
gpu | O número de núcleos gpu no contentor. | int |
memoryInGB | A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
instanceType | Tipo de instância de computação. | string |
readinessProbe | Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. | ProbeSettings |
Definição de recurso de modelo do ARM
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:
- Grupos de recursos – veja comandos de implementação de grupos de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte JSON ao seu modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
Objetos OnlineDeployment
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para K8S, utilize:
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
Para Gerido, utilize:
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
Objetos AssetReferenceBase
Defina a propriedade referenceType para especificar o tipo de objeto.
Para DataPath, utilize:
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
Para O ID, utilize:
"referenceType": "Id",
"assetId": "string"
Para OutputPath, utilize:
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Automático, utilize:
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Para Manual, utilize:
"scaleType": "Manual",
"instanceCount": "int"
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | A versão da API de recursos | '2021-03-01-preview' |
name | O nome do recurso Veja como definir nomes e tipos para recursos subordinados em modelos do ARM JSON. |
cadeia (obrigatório) |
localização | A localização geográfica onde o recurso se encontra | cadeia (obrigatório) |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
identidade | Identidade de serviço associada a um recurso. | ResourceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeployment (obrigatório) |
ResourceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Define valores para o tipo resourceIdentity. | "Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrição | Valor |
---|---|---|
clientId | Também conhecido como ID da aplicação, um identificador exclusivo gerado pelo Azure AD associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. | string |
principalId | O ID do objeto do principal de serviço para a sua identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. | string |
OnlineDeployment
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
environmentId | ID de recurso do ARM da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. | ProbeSettings |
model | Referência ao recurso de modelo para a implementação do ponto final. | AssetReferenceBase |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | OnlineDeploymentProperties |
requestSettings | Configuração de pedidos de classificação de implementação online. | OnlineRequestSettings |
scaleSettings | Configuração de dimensionamento de implementação online. | OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | K8S Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
AssetReferenceBase
Nome | Descrição | Valor |
---|---|---|
referenceType | Definir o tipo de objeto | DataPath ID OutputPath (obrigatório) |
DataPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "DataPath" (obrigatório) |
datastoreId | ID do recurso arm do arquivo de dados onde o recurso está localizado. | string |
caminho | O caminho do ficheiro/diretório no arquivo de dados. | string |
IdAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "ID" (obrigatório) |
assetId | [Obrigatório] ID do recurso arm do recurso. | cadeia (obrigatório) Restrições: Padrão = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "OutputPath" (obrigatório) |
jobId | ID de recurso do ARM da tarefa. | string |
caminho | O caminho do ficheiro/diretório na saída da tarefa. | string |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número de pedidos permitidos em fila de uma só vez para esta implementação. | int |
maxQueueWait | O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. | string |
requestTimeout | O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. | string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | Número máximo de instâncias para esta implementação. | int |
minInstances | Número mínimo de instâncias para esta implementação. | int |
scaleType | Definir o tipo de objeto | Automático Manual (obrigatório) |
Dimensionamento AutomáticoDefinições
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Automático" (obrigatório) |
pollingInterval | O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
ManualScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Manual" (obrigatório) |
instanceCount | Número fixo de instâncias para esta implementação. | int |
K8SOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "K8S" (obrigatório) |
containerResourceRequirements | Requisitos de recursos para cada instância de contentor numa implementação online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
cpu | A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. | int |
gpu | O número de núcleos de GPU no contentor. | int |
memoryInGB | A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
instanceType | Tipo de instância de computação. | string |
readinessProbe | Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. | ProbeSettings |
Definição de recurso terraform (fornecedor AzAPI)
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:
- Grupos de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Terraform ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
Objetos OnlineDeployment
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para K8S, utilize:
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
Para Gerido, utilize:
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
Objetos AssetReferenceBase
Defina a propriedade referenceType para especificar o tipo de objeto.
Para DataPath, utilize:
referenceType = "DataPath"
datastoreId = "string"
path = "string"
Para O ID, utilize:
referenceType = "Id"
assetId = "string"
Para OutputPath, utilize:
referenceType = "OutputPath"
jobId = "string"
path = "string"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Automático, utilize:
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
Para Manual, utilize:
scaleType = "Manual"
instanceCount = int
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
name | O nome do recurso | cadeia (obrigatório) |
localização | A localização geográfica onde reside o recurso | cadeia (obrigatório) |
parent_id | O ID do recurso que é o principal para este recurso. | ID do recurso do tipo: onlineEndpoints |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
identidade | Identidade de serviço associada a um recurso. | ResourceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeployment (obrigatório) |
ResourceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Define valores para o tipo de ResourceIdentity. | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | Dicionário das identidades atribuídas pelo utilizador, a chave é o ID de recurso do ARM da UAI. | Matriz de IDs de identidade do utilizador. |
ResourceIdentityUserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrição | Valor |
---|---|---|
clientId | Também conhecido como ID da aplicação, um identificador exclusivo gerado por Azure AD que está associado a uma aplicação e principal de serviço durante o aprovisionamento inicial. | string |
principalId | O ID de objeto do objeto do principal de serviço para a identidade gerida que é utilizado para conceder acesso baseado em funções a um recurso do Azure. | string |
OnlineDeployment
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
environmentId | ID do recurso arm da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuração da pesquisa de disponibilidade/liveness do contentor de implementação. | ProbeSettings |
model | Referência ao recurso de modelo para a implementação do ponto final. | AssetReferenceBase |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | OnlineDeploymentProperties |
requestSettings | Configuração de pedidos de classificação de implementação online. | OnlineRequestSettings |
scaleSettings | Configuração do dimensionamento da implementação online. | OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | K8S Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
AssetReferenceBase
Nome | Descrição | Valor |
---|---|---|
referenceType | Definir o tipo de objeto | DataPath ID OutputPath (obrigatório) |
DataPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "DataPath" (obrigatório) |
datastoreId | ID de recurso arm do arquivo de dados onde o recurso está localizado. | string |
caminho | O caminho do ficheiro/diretório no arquivo de dados. | string |
IdAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "ID" (obrigatório) |
assetId | [Obrigatório] ID do recurso arm do recurso. | cadeia (obrigatório) Restrições: Padrão = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrição | Valor |
---|---|---|
referenceType | [Obrigatório] Especifica o tipo de referência de recursos. | "OutputPath" (obrigatório) |
jobId | ID do recurso arm da tarefa. | string |
caminho | O caminho do ficheiro/diretório na saída da tarefa. | string |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
{customized property} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número de pedidos permitidos em fila ao mesmo tempo para esta implementação. | int |
maxQueueWait | O tempo máximo de espera da fila no formato ISO 8601. Suporta precisão de milissegundos. | string |
requestTimeout | O tempo limite do pedido no formato ISO 8601. Suporta precisão de milissegundos. | string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | Número máximo de instâncias para esta implementação. | int |
minInstances | Número mínimo de instâncias para esta implementação. | int |
scaleType | Definir o tipo de objeto | Automático Manual (obrigatório) |
Dimensionamento AutomáticoDefinições
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Automático" (obrigatório) |
pollingInterval | O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
ManualScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Manual" (obrigatório) |
instanceCount | Número fixo de instâncias para esta implementação. | int |
K8SOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "K8S" (obrigatório) |
containerResourceRequirements | Requisitos de recursos para cada instância de contentor numa implementação online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
cpu | A quantidade mínima de núcleos de CPU a utilizar pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | A quantidade máxima de núcleos de CPU permitidos para serem utilizados pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | O número de dispositivos FPGA PCIE expostos ao contentor. Tem de ser múltiplo de 2. | int |
gpu | O número de núcleos gpu no contentor. | int |
memoryInGB | A quantidade mínima de memória (em GB) a ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | A quantidade máxima de memória (em GB) permitida para ser utilizada pelo contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
instanceType | Tipo de instância de computação. | string |
readinessProbe | Configuração da pesquisa de disponibilidade/disponibilidade do contentor de implementação. | ProbeSettings |
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários