Workspaces do Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-04-01
Definição de recurso do Bicep
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Bicep a seguir ao seu modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Para managed, use:
endpointComputeType: 'Managed'
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
scaleType: 'Default'
Para TargetUtilization, use:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
nome | O nome do recurso Veja como definir nomes e tipos para recursos filho no Bicep. |
cadeia de caracteres (obrigatório) |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
Tags | Marcas de recurso. | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
pai | No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai. Para obter mais informações, consulte recurso filho fora do recurso pai. |
Nome simbólico para o recurso do tipo: onlineEndpoints |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | 'Desabilitado' 'Habilitado' |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto |
do Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto |
padrão de TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
Definição de recurso de modelo do ARM
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o JSON a seguir ao seu modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-04-01",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Para managed, use:
"endpointComputeType": "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
"scaleType": "Default"
Para TargetUtilization, use:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | A versão da API do recurso | '2023-04-01' |
nome | O nome do recurso Veja como definir nomes e tipos para recursos filho em modelos do ARM JSON. |
cadeia de caracteres (obrigatório) |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
Tags | Marcas de recurso. | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | 'Desabilitado' 'Habilitado' |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto |
do Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto |
padrão de TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
Definição de recurso do Terraform (provedor de AzAPI)
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- grupos de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Terraform a seguir ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Para managed, use:
endpointComputeType = "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
scaleType = "Default"
Para TargetUtilization, use:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01" |
nome | O nome do recurso | cadeia de caracteres (obrigatório) |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
parent_id | A ID do recurso que é o pai desse recurso. | ID do recurso do tipo: onlineEndpoints |
Tags | Marcas de recurso. | Dicionário de nomes e valores de marca. |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório) |
identity_ids | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | Matriz de IDs de identidade do usuário. |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | "Desabilitado" "Habilitado" |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto |
do Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | corda |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto |
padrão de TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | "Padrão" (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | "TargetUtilization" (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | "Kubernetes" (obrigatório) |
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | "Gerenciado" (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | "Básico" "Gratuito" "Premium" "Standard" |