Aree di lavoro Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-12-01-preview
Definizione di risorsa Bicep
Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:
- Gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il modello Bicep seguente.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Oggetti OnlineDeploymentProperties
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per Kubernetes, usare:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Per Managed, usare:
endpointComputeType: 'Managed'
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType per specificare il tipo di oggetto.
Per Impostazione predefinita, usare:
scaleType: 'Default'
Per TargetUtilization, usare:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Valori delle proprietà
aree di lavoro/onlineEndpoints/distribuzioni
Nome | Descrizione | valore |
---|---|---|
name | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in Bicep. |
stringa (obbligatoria) |
posizione | Posizione geografica in cui vive la risorsa | stringa (obbligatoria) |
tags | Tag di risorse. | Dizionario dei nomi e dei valori dei tag. Vedere Tag nei modelli |
sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | Sku |
kind | Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | string |
padre | In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre. Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre. |
Nome simbolico per la risorsa di tipo: onlineEndpoints |
identity | Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) | ManagedServiceIdentity |
properties | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeploymentProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obbligatorio) |
userAssignedIdentities | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
description | Descrizione della distribuzione dell'endpoint. | string |
egressPublicNetworkAccess | Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. | 'Disabilitato' 'Enabled' |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | string |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo di istanza di calcolo. | string |
livenessProbe | Il probe di attività monitora regolarmente l'integrità del contenitore. | ProbeSettings |
model | Percorso URI del modello. | string |
modelMountPath | Percorso di montaggio del modello nel contenitore personalizzato. | string |
properties | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Il probe di conformità verifica se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono le stesse del probe di attività. | ProbeSettings |
requestSettings | Richiedere le impostazioni per la distribuzione. | OnlineRequestSettings |
scaleSettings | Impostazioni di scalabilità per la distribuzione. Se è null o non specificato, il valore predefinito è TargetUtilizationScaleSettings per KubernetesOnlineDeployment e in DefaultScaleSettings per ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto | Kubernetes Gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | string |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | INT |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | string |
period | Intervallo di tempo tra probe in formato ISO 8601. | string |
successThreshold | Numero di probe con esito positivo prima di restituire uno stato integro. | INT |
timeout | Timeout del probe in formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero massimo di richieste simultanee consentite per nodo per distribuzione. Assume il valore predefinito 1. | INT |
maxQueueWait | La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601. Il valore predefinito è 500 ms. |
string |
requestTimeout | Timeout di assegnazione dei punteggi in formato ISO 8601. Il valore predefinito è 5000 ms. |
string |
OnlineScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | Impostare il tipo di oggetto | Default TargetUtilization (obbligatorio) |
DefaultScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | 'Default' (obbligatorio) |
TargetUtilizationScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | 'TargetUtilization' (obbligatorio) |
maxInstances | Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. | INT |
minInstances | Numero minimo di istanze da presentare sempre. | INT |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione ridotta a secondi. | string |
targetUtilizationPercentage | Usare la CPU di destinazione per il ridimensionamento automatico. | INT |
KubernetesOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'Kubernetes' (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per il contenitore (CPU e memoria). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
containerResourceLimits | Informazioni sul limite di risorse contenitore: | ContainerResourceSettings |
containerResourceRequests | Informazioni sulla richiesta di risorse contenitore: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrizione | Valore |
---|---|---|
cpu | Numero di richieste/limiti di vCPU per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memoria | Richiesta/limite di dimensioni della memoria per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'Managed' (obbligatorio) |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta la scalabilità orizzontale/in, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, è possibile che venga omesso. | INT |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. | string |
name | Il nome della SKU. Ex - P3. In genere è un codice lettera+numero | stringa (obbligatoria) |
size | Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. | string |
Livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. | 'Basic' 'Free' 'Premium' 'Standard' |
Definizione della risorsa modello di Resource Manager
Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:
- Gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice JSON seguente al modello.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-12-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Oggetti OnlineDeploymentProperties
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per Kubernetes, usare:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Per Managed, usare:
"endpointComputeType": "Managed"
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType per specificare il tipo di oggetto.
Per Impostazione predefinita, usare:
"scaleType": "Default"
Per TargetUtilization, usare:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Valori delle proprietà
aree di lavoro/onlineEndpoints/distribuzioni
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di risorsa | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | Versione dell'API risorsa | '2022-12-01-preview' |
name | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio nei modelli di RESOURCE JSON. |
stringa (obbligatoria) |
posizione | Posizione geografica in cui vive la risorsa | stringa (obbligatoria) |
tags | Tag di risorse. | Dizionario dei nomi e dei valori dei tag. Vedere Tag nei modelli |
sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | Sku |
kind | Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | string |
identity | Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) | ManagedServiceIdentity |
properties | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeploymentProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obbligatorio) |
userAssignedIdentities | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
description | Descrizione della distribuzione dell'endpoint. | string |
egressPublicNetworkAccess | Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. | 'Disabilitato' 'Enabled' |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | string |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo di istanza di calcolo. | string |
livenessProbe | Il probe di attività monitora regolarmente l'integrità del contenitore. | ProbeSettings |
model | Percorso URI del modello. | string |
modelMountPath | Percorso di montaggio del modello nel contenitore personalizzato. | string |
properties | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Il probe di conformità verifica se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono le stesse del probe di attività. | ProbeSettings |
requestSettings | Richiedere le impostazioni per la distribuzione. | OnlineRequestSettings |
scaleSettings | Impostazioni di scalabilità per la distribuzione. Se è null o non specificato, il valore predefinito è TargetUtilizationScaleSettings per KubernetesOnlineDeployment e in DefaultScaleSettings per ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto | Kubernetes Gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | string |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | INT |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | string |
period | Intervallo di tempo tra probe in formato ISO 8601. | string |
successThreshold | Numero di probe con esito positivo prima di restituire uno stato integro. | INT |
timeout | Timeout del probe in formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero di richieste simultanee massime consentite per ogni nodo consentito per distribuzione. Assume il valore predefinito 1. | INT |
maxQueueWait | L'intervallo massimo di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601. Il valore predefinito è 500ms. |
string |
requestTimeout | Timeout di assegnazione dei punteggi nel formato ISO 8601. Il valore predefinito è 5000ms. |
string |
OnlineScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | Impostare il tipo di oggetto | Default TargetUtilization (obbligatorio) |
DefaultScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | 'Default' (obbligatorio) |
TargetUtilizationScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | 'TargetUtilization' (obbligatorio) |
maxInstances | Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota sarà riservata per max_instances. | INT |
minInstances | Numero minimo di istanze da presentare sempre. | INT |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. | string |
targetUtilizationPercentage | Utilizzo della CPU di destinazione per il ridimensionamento automatico. | INT |
KubernetesOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'Kubernetes' (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per il contenitore (CPU e memoria). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
containerResourceLimits | Informazioni sul limite delle risorse contenitore: | ContainerResourceSettings |
containerResourceRequests | Informazioni sulla richiesta di risorse contenitore: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrizione | Valore |
---|---|---|
cpu | Numero di richieste/limite di vCPUs per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Numero di schede GPU Nvidia richiesta/limite per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memoria | Richiesta/limite delle dimensioni della memoria per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'Managed' (obbligatorio) |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta la scalabilità orizzontale/in, l'intero della capacità deve essere incluso. Se la scalabilità orizzontale/in non è possibile per la risorsa, potrebbe essere omessa. | INT |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. | string |
name | Il nome della SKU. Ex - P3. In genere è un codice lettera+numero | stringa (obbligatoria) |
size | Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. | string |
Livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. | 'Basic' 'Free' 'Premium' 'Standard' |
Definizione della risorsa Terraform (provider AzAPI)
Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:
- Gruppi di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice Terraform seguente al modello.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Oggetti OnlineDeploymentProperties
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per Kubernetes, usare:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Per Managed, usare:
endpointComputeType = "Managed"
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType per specificare il tipo di oggetto.
Per Impostazione predefinita, usare:
scaleType = "Default"
Per TargetUtilization, usare:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Valori delle proprietà
aree di lavoro/onlineEndpoints/distribuzioni
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di risorsa | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview" |
name | Nome della risorsa | stringa (obbligatoria) |
posizione | Posizione geografica in cui vive la risorsa | stringa (obbligatoria) |
parent_id | ID della risorsa padre per questa risorsa. | ID per la risorsa di tipo: onlineEndpoints |
tags | Tag di risorse. | Dizionario dei nomi e dei valori dei tag. |
sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | Sku |
kind | Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | string |
identity | Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) | ManagedServiceIdentity |
properties | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeploymentProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obbligatorio) |
identity_ids | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | Matrice di ID identità utente. |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
description | Descrizione della distribuzione dell'endpoint. | string |
egressPublicNetworkAccess | Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un'uscita sicura. Impostazione predefinita: abilitata. | "Disabilitato" "Abilitato" |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | string |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo di istanza di calcolo. | string |
livenessProbe | Il probe liveness monitora regolarmente l'integrità del contenitore. | ProbeSettings |
model | Percorso URI del modello. | string |
modelMountPath | Percorso per montare il modello nel contenitore personalizzato. | string |
properties | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Il probe di conformità convalida se il contenitore è pronto per servire il traffico. Le proprietà e le impostazioni predefinite sono uguali al probe di livezza. | ProbeSettings |
requestSettings | Richiedere le impostazioni per la distribuzione. | OnlineRequestSettings |
scaleSettings | Ridimensionare le impostazioni per la distribuzione. Se è null o non specificato, impostazione predefinita per TargetUtilizationScaleSettings per KubernetesOnlineDeployment e in DefaultScaleSettings per ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto | Kubernetes Gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | string |
assegnazione dei punteggiScript | [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" | stringa (obbligatoria) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | INT |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | string |
period | Intervallo di tempo tra probe in formato ISO 8601. | string |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | INT |
timeout | Timeout del probe in formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | string | |
{proprietà personalizzata} | string |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero massimo di richieste simultanee consentite per nodo per distribuzione. Assume il valore predefinito 1. | INT |
maxQueueWait | La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601. Il valore predefinito è 500 ms. |
string |
requestTimeout | Timeout di assegnazione dei punteggi in formato ISO 8601. Il valore predefinito è 5000 ms. |
string |
OnlineScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | Impostare il tipo di oggetto | Default TargetUtilization (obbligatorio) |
DefaultScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | "Default" (obbligatorio) |
TargetUtilizationScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione | "TargetUtilization" (obbligatorio) |
maxInstances | Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. | INT |
minInstances | Numero minimo di istanze da presentare sempre. | INT |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione ridotta a secondi. | string |
targetUtilizationPercentage | Usare la CPU di destinazione per il ridimensionamento automatico. | INT |
KubernetesOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | "Kubernetes" (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per il contenitore (CPU e memoria). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
containerResourceLimits | Informazioni sul limite di risorse contenitore: | ContainerResourceSettings |
containerResourceRequests | Informazioni sulla richiesta di risorse contenitore: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrizione | Valore |
---|---|---|
cpu | Numero di richieste/limiti di vCPU per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memoria | Richiesta/limite di dimensioni della memoria per il contenitore. Per altre informazioni, vedere: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | "Gestito" (obbligatorio) |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta la scalabilità orizzontale/in, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, è possibile che venga omesso. | INT |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, può essere acquisito qui. | string |
name | Il nome della SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero | stringa (obbligatorio) |
size | Dimensioni dello SKU. Quando il campo name è la combinazione di livello e un altro valore, si tratta del codice autonomo. | string |
Livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un put. | "Basic" "Gratuito" "Premium" "Standard" |
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per