Áreas de trabalho Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-02-01-preview
Definição de recurso do Bicep
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:
- Grupos de recursos – veja os comandos de implementação do grupo de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao seu modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
privateNetworkConnection: bool
properties: {}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentDetails objects
}
}
Objetos OnlineDeploymentDetails
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para o Kubernetes, utilize:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Para Gerido, utilize:
endpointComputeType: 'Managed'
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Predefinição, utilize:
scaleType: 'Default'
Para TargetUtilization, utilize:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
name | O nome do recurso Veja como definir nomes e tipos para recursos subordinados no Bicep. |
cadeia (obrigatório) |
localização | A localização geográfica onde reside o recurso | cadeia (obrigatório) |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos |
sku | Detalhes do SKU necessários para o contrato arm para dimensionamento automático. | SKU |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
principal | No Bicep, pode especificar o recurso principal de um recurso subordinado. Só tem de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal. Para obter mais informações, veja Recurso subordinado fora do recurso principal. |
Nome simbólico para recurso do tipo: onlineEndpoints |
identidade | Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) | ManagedServiceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentDetails (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). | "Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. | objeto |
OnlineDeploymentDetails
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
egressPublicNetworkAccess | Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. | "Desativado" "Ativado" |
environmentId | ID do recurso arm da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | objeto |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. | ProbeSettings |
model | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo num contentor personalizado. | string |
privateNetworkConnection | Se for verdadeiro, ative a ligação de rede privada. PRETERIDO para futuras versões de API. Utilize EgressPublicNetworkAccess. |
bool |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | objeto |
readinessProbe | A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. | ProbeSettings |
requestSettings | Definições de pedido para a implementação. | OnlineRequestSettings |
scaleSettings | Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de pedidos simultâneos por nó permitidos por implementação. A predefinição é 1. | int |
maxQueueWait | O período máximo de tempo durante o qual um pedido permanecerá na fila no formato ISO 8601. A predefinição é 500ms. |
string |
requestTimeout | O tempo limite de classificação no formato ISO 8601. A predefinição é 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Predefinição TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Predefinição" (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "TargetUtilization" (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a estar sempre presente. | int |
pollingInterval | O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Kubernetes" (obrigatório) |
containerResourceRequirements | Os requisitos de recursos para o contentor (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contentor: | ContainerResourceSettings |
containerResourceRequests | Informações do pedido de recurso de contentor: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de pedidos/limite de cartões GPU Nvidia para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Memória | Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. | string |
name | O nome do SKU. Ex - P3. Normalmente, é um código letter+number | cadeia (obrigatório) |
size | O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. | string |
tier | Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. | "Básico" 'Gratuito' "Premium" 'Standard' |
Definição de recurso do modelo arm
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações direcionadas:
- Grupos de recursos – veja os comandos de implementação do grupo de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, veja Registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte JSON ao seu modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-02-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"privateNetworkConnection": "bool",
"properties": {},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentDetails objects
}
}
Objetos OnlineDeploymentDetails
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para o Kubernetes, utilize:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Para Gerido, utilize:
"endpointComputeType": "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Predefinição, utilize:
"scaleType": "Default"
Para TargetUtilization, utilize:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | A versão da API de recursos | '2022-02-01-preview' |
name | O nome do recurso Veja como definir nomes e tipos para recursos subordinados em modelos arm JSON. |
cadeia (obrigatório) |
localização | A localização geográfica onde reside o recurso | cadeia (obrigatório) |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos |
sku | Detalhes do SKU necessários para o contrato arm para dimensionamento automático. | SKU |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
identidade | Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) | ManagedServiceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentDetails (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). | "Nenhum" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. | objeto |
OnlineDeploymentDetails
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
egressPublicNetworkAccess | Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. | "Desativado" "Ativado" |
environmentId | ID do recurso arm da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | objeto |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. | ProbeSettings |
model | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo num contentor personalizado. | string |
privateNetworkConnection | Se for verdadeiro, ative a ligação de rede privada. PRETERIDO para futuras versões de API. Utilize EgressPublicNetworkAccess. |
bool |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | objeto |
readinessProbe | A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. | ProbeSettings |
requestSettings | Definições de pedido para a implementação. | OnlineRequestSettings |
scaleSettings | Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1. | int |
maxQueueWait | A quantidade máxima de tempo que um pedido permanecerá na fila no formato ISO 8601. A predefinição é de 500ms. |
string |
requestTimeout | O tempo limite de classificação no formato ISO 8601. A predefinição é de 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Predefinição TargetUtilization (necessário) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Predefinição" (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "TargetUtilization" (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a estar sempre presente. | int |
pollingInterval | O intervalo de consulta no formato ISO 8691. Suporta apenas a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Kubernetes" (obrigatório) |
containerResourceRequirements | Os requisitos de recursos para o contentor (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações sobre o limite de recursos de contentor: | ContainerResourceSettings |
containerResourceRequests | Informações do pedido de recurso de contentor: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de cartões GPU Nvidia pedido/limite para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Memória | Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU suportar o aumento horizontal/in, o número inteiro de capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente o recurso, tal poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. | string |
name | O nome do SKU. Ex - P3. Normalmente, é um código letter+number | cadeia (obrigatório) |
size | O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. | string |
tier | Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. | "Básico" 'Gratuito' "Premium" 'Standard' |
Definição de recurso do Terraform (fornecedor AzAPI)
O tipo de recurso áreas de trabalho/onlineEndpoints/deployments pode ser implementado com operações que visam:
- Grupos de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.
Formato do recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Terraform ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
privateNetworkConnection = bool
properties = {}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentDetails objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objetos OnlineDeploymentDetails
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para o Kubernetes, utilize:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Para Gerido, utilize:
endpointComputeType = "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Predefinição, utilize:
scaleType = "Default"
Para TargetUtilization, utilize:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Valores de propriedade
áreas de trabalho/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview" |
name | O nome do recurso | cadeia (obrigatório) |
localização | A localização geográfica onde reside o recurso | cadeia (obrigatório) |
parent_id | O ID do recurso que é o principal para este recurso. | ID do recurso do tipo: onlineEndpoints |
etiquetas | Etiquetas de recursos. | Dicionário de nomes e valores de etiquetas. |
sku | Detalhes do SKU necessários para o contrato arm para dimensionamento automático. | SKU |
tipo | Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. | string |
identidade | Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) | ManagedServiceIdentity |
propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentDetails (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório) |
identity_ids | O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. | Matriz de IDs de identidade do utilizador. |
OnlineDeploymentDetails
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for verdadeiro, ativa o registo do Application Insights. | bool |
codeConfiguration | Configuração de código para a implementação do ponto final. | CodeConfiguration |
descrição | Descrição da implementação do ponto final. | string |
egressPublicNetworkAccess | Se estiver Ativado, permita o acesso à rede pública de saída. Se Estiver Desativado, esta ação criará uma saída segura. Predefinição: ativado. | "Desativado" "Ativado" |
environmentId | ID do recurso arm da especificação do ambiente para a implementação do ponto final. | string |
environmentVariables | Configuração de variáveis de ambiente para a implementação. | objeto |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. | ProbeSettings |
model | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo num contentor personalizado. | string |
privateNetworkConnection | Se for verdadeiro, ative a ligação de rede privada. PRETERIDO para futuras versões de API. Utilize EgressPublicNetworkAccess. |
bool |
propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | objeto |
readinessProbe | A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. | ProbeSettings |
requestSettings | Definições de pedido para a implementação. | OnlineRequestSettings |
scaleSettings | Definições de dimensionamento para a implementação. Se for nulo ou não for fornecido, a predefinição é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerido (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do recurso de código. | string |
scoreScript | [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" | cadeia (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a permitir antes de devolver um mau estado de funcionamento. | int |
initialDelay | O atraso antes da primeira pesquisa no formato ISO 8601. | string |
period | O período de tempo entre sondas no formato ISO 8601. | string |
successThreshold | O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. | int |
tempo limite | O tempo limite da sonda no formato ISO 8601. | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de pedidos simultâneos por nó permitidos por implementação. A predefinição é 1. | int |
maxQueueWait | O período máximo de tempo durante o qual um pedido permanecerá na fila no formato ISO 8601. A predefinição é 500ms. |
string |
requestTimeout | O tempo limite de classificação no formato ISO 8601. A predefinição é 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Predefinição TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "Predefinição" (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implementação | "TargetUtilization" (obrigatório) |
maxInstances | O número máximo de instâncias para as quais a implementação pode ser dimensionada. A quota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a estar sempre presente. | int |
pollingInterval | O intervalo de consulta no formato ISO 8691. Só suporta a duração com precisão tão baixa como Segundos. | string |
targetUtilizationPercentage | Utilização da CPU de destino para o dimensionador automático. | int |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Kubernetes" (obrigatório) |
containerResourceRequirements | Os requisitos de recursos para o contentor (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contentor: | ContainerResourceSettings |
containerResourceRequests | Informações do pedido de recurso de contentor: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de pedidos/limite de vCPUs para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de pedidos/limite de cartões GPU Nvidia para contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Memória | Pedido/limite de tamanho da memória para o contentor. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto final. | "Gerido" (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. | string |
name | O nome do SKU. Ex - P3. Normalmente, é um código letter+number | cadeia (obrigatório) |
size | O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. | string |
tier | Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. | "Básico" "Gratuito" "Premium" "Standard" |