Aree di lavoro Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview
Definizione di risorsa Bicep
Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il bicep seguente al modello.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
Oggetti OnlineDeployment
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per K8S, usare:
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
Per gestito, usare:
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
Oggetti AssetReferenceBase
Impostare la proprietà referenceType
Per DataPath, usare:
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
Per ID, usare:
referenceType: 'Id'
assetId: 'string'
Per OutputPath, usare:
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType
Per automatico, usare:
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
Per Manuale, usare:
scaleType: 'Manual'
instanceCount: int
Valori delle proprietà
workspaces/onlineEndpoints/deployments
Nome | Descrizione | Valore |
---|---|---|
nome | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in Bicep. |
stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. Vedere tag nei modelli |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
genitore | In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre. Per altre informazioni, vedere risorsa figlio all'esterno della risorsa padre. |
Nome simbolico per la risorsa di tipo: onlineEndpoints |
identità | Identità del servizio associata a una risorsa. | resourceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeployment (obbligatorio) |
ResourceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Definisce i valori per il tipo di ResourceIdentity. | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'interfaccia utente. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrizione | Valore |
---|---|---|
clientId | ID applicazione, un identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. | corda |
principalId | ID oggetto dell'oggetto entità servizio per l'identità gestita usata per concedere l'accesso in base al ruolo a una risorsa di Azure. | corda |
OnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | Bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
descrizione | Descrizione della distribuzione dell'endpoint. | corda |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | corda |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. | ProbeSettings |
modello | Riferimento all'asset del modello per la distribuzione dell'endpoint. | AssetReferenceBase |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | OnlineDeploymentProperties |
requestSettings | Configurazione delle richieste di assegnazione dei punteggi per la distribuzione online. | OnlineRequestSettings |
scaleSettings | Configurazione del ridimensionamento della distribuzione online. | OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto |
K8S gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
AssetReferenceBase
Nome | Descrizione | Valore |
---|---|---|
referenceType | Impostare il tipo di oggetto |
DataPath id OutputPath (obbligatorio) |
DataPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'DataPath' (obbligatorio) |
datastoreId | ID risorsa ARM dell'archivio dati in cui si trova l'asset. | corda |
sentiero | Percorso del file o della directory nell'archivio dati. | corda |
IdAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'Id' (obbligatorio) |
assetId | [Obbligatorio] ID risorsa ARM dell'asset. | stringa (obbligatorio) Vincoli: Pattern = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'OutputPath' (obbligatorio) |
jobId | ID risorsa ARM del processo. | corda |
sentiero | Percorso del file o della directory nell'output del processo. | corda |
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero di richieste consentite per accodare contemporaneamente per questa distribuzione. | Int |
maxQueueWait | Tempo di attesa massimo della coda nel formato ISO 8601. Supporta la precisione in millisecondi. | corda |
requestTimeout | Timeout della richiesta in formato ISO 8601. Supporta la precisione in millisecondi. | corda |
OnlineScaleSettings
AutoScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | 'Auto' (obbligatorio) |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. | corda |
targetUtilizationPercentage | Usare la CPU di destinazione per il ridimensionamento automatico. | Int |
ManualScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | 'Manual' (obbligatorio) |
instanceCount | Numero fisso di istanze per questa distribuzione. | Int |
K8SOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'K8S' (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per ogni istanza di contenitore all'interno di una distribuzione online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
CPU | Quantità minima di core CPU da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Quantità massima di core CPU che possono essere usati dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Numero di dispositivi PCIE FPGA esposti al contenitore. Deve essere multiplo di 2. | Int |
Gpu | Numero di core GPU nel contenitore. | Int |
memoryInGB | Quantità minima di memoria (in GB) da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Quantità massima di memoria (in GB) consentita dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
ManagedOnlineDeployment
Definizione di risorsa del modello di Resource Manager
Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice JSON seguente al modello.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
Oggetti OnlineDeployment
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per K8S, usare:
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
Per gestito, usare:
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
Oggetti AssetReferenceBase
Impostare la proprietà referenceType
Per DataPath, usare:
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
Per ID, usare:
"referenceType": "Id",
"assetId": "string"
Per OutputPath, usare:
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType
Per automatico, usare:
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Per Manuale, usare:
"scaleType": "Manual",
"instanceCount": "int"
Valori delle proprietà
workspaces/onlineEndpoints/deployments
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di risorsa | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | Versione dell'API della risorsa | '2021-03-01-preview' |
nome | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in modelli DI Resource Manager JSON. |
stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. Vedere tag nei modelli |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
identità | Identità del servizio associata a una risorsa. | resourceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeployment (obbligatorio) |
ResourceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Definisce i valori per il tipo di ResourceIdentity. | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'interfaccia utente. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrizione | Valore |
---|---|---|
clientId | ID applicazione, un identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. | corda |
principalId | ID oggetto dell'oggetto entità servizio per l'identità gestita usata per concedere l'accesso in base al ruolo a una risorsa di Azure. | corda |
OnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | Bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
descrizione | Descrizione della distribuzione dell'endpoint. | corda |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | corda |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. | ProbeSettings |
modello | Riferimento all'asset del modello per la distribuzione dell'endpoint. | AssetReferenceBase |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | OnlineDeploymentProperties |
requestSettings | Configurazione delle richieste di assegnazione dei punteggi per la distribuzione online. | OnlineRequestSettings |
scaleSettings | Configurazione del ridimensionamento della distribuzione online. | OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto |
K8S gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
AssetReferenceBase
Nome | Descrizione | Valore |
---|---|---|
referenceType | Impostare il tipo di oggetto |
DataPath id OutputPath (obbligatorio) |
DataPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'DataPath' (obbligatorio) |
datastoreId | ID risorsa ARM dell'archivio dati in cui si trova l'asset. | corda |
sentiero | Percorso del file o della directory nell'archivio dati. | corda |
IdAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'Id' (obbligatorio) |
assetId | [Obbligatorio] ID risorsa ARM dell'asset. | stringa (obbligatorio) Vincoli: Pattern = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | 'OutputPath' (obbligatorio) |
jobId | ID risorsa ARM del processo. | corda |
sentiero | Percorso del file o della directory nell'output del processo. | corda |
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero di richieste consentite per accodare contemporaneamente per questa distribuzione. | Int |
maxQueueWait | Tempo di attesa massimo della coda nel formato ISO 8601. Supporta la precisione in millisecondi. | corda |
requestTimeout | Timeout della richiesta in formato ISO 8601. Supporta la precisione in millisecondi. | corda |
OnlineScaleSettings
AutoScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | 'Auto' (obbligatorio) |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. | corda |
targetUtilizationPercentage | Usare la CPU di destinazione per il ridimensionamento automatico. | Int |
ManualScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | 'Manual' (obbligatorio) |
instanceCount | Numero fisso di istanze per questa distribuzione. | Int |
K8SOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | 'K8S' (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per ogni istanza di contenitore all'interno di una distribuzione online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
CPU | Quantità minima di core CPU da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Quantità massima di core CPU che possono essere usati dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Numero di dispositivi PCIE FPGA esposti al contenitore. Deve essere multiplo di 2. | Int |
Gpu | Numero di core GPU nel contenitore. | Int |
memoryInGB | Quantità minima di memoria (in GB) da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Quantità massima di memoria (in GB) consentita dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
ManagedOnlineDeployment
Definizione di risorsa Terraform (provider AzAPI)
Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:
- gruppi di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice Terraform seguente al modello.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
Oggetti OnlineDeployment
Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.
Per K8S, usare:
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
Per gestito, usare:
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
Oggetti AssetReferenceBase
Impostare la proprietà referenceType
Per DataPath, usare:
referenceType = "DataPath"
datastoreId = "string"
path = "string"
Per ID, usare:
referenceType = "Id"
assetId = "string"
Per OutputPath, usare:
referenceType = "OutputPath"
jobId = "string"
path = "string"
Oggetti OnlineScaleSettings
Impostare la proprietà scaleType
Per automatico, usare:
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
Per Manuale, usare:
scaleType = "Manual"
instanceCount = int
Valori delle proprietà
workspaces/onlineEndpoints/deployments
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di risorsa | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
nome | Nome della risorsa | stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
parent_id | ID della risorsa padre per questa risorsa. | ID per la risorsa di tipo: onlineEndpoints |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
identità | Identità del servizio associata a una risorsa. | resourceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | OnlineDeployment (obbligatorio) |
ResourceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Definisce i valori per il tipo di ResourceIdentity. | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | Dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'interfaccia utente. | Matrice di ID identità utente. |
ResourceIdentityUserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nome | Descrizione | Valore |
---|---|---|
clientId | ID applicazione, un identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. | corda |
principalId | ID oggetto dell'oggetto entità servizio per l'identità gestita usata per concedere l'accesso in base al ruolo a una risorsa di Azure. | corda |
OnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
appInsightsEnabled | Se true, abilita la registrazione di Application Insights. | Bool |
codeConfiguration | Configurazione del codice per la distribuzione dell'endpoint. | CodeConfiguration |
descrizione | Descrizione della distribuzione dell'endpoint. | corda |
environmentId | ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. | corda |
environmentVariables | Configurazione delle variabili di ambiente per la distribuzione. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. | ProbeSettings |
modello | Riferimento all'asset del modello per la distribuzione dell'endpoint. | AssetReferenceBase |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | OnlineDeploymentProperties |
requestSettings | Configurazione delle richieste di assegnazione dei punteggi per la distribuzione online. | OnlineRequestSettings |
scaleSettings | Configurazione del ridimensionamento della distribuzione online. | OnlineScaleSettings |
endpointComputeType | Impostare il tipo di oggetto |
K8S gestito (obbligatorio) |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
AssetReferenceBase
Nome | Descrizione | Valore |
---|---|---|
referenceType | Impostare il tipo di oggetto |
DataPath id OutputPath (obbligatorio) |
DataPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | "DataPath" (obbligatorio) |
datastoreId | ID risorsa ARM dell'archivio dati in cui si trova l'asset. | corda |
sentiero | Percorso del file o della directory nell'archivio dati. | corda |
IdAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | "Id" (obbligatorio) |
assetId | [Obbligatorio] ID risorsa ARM dell'asset. | stringa (obbligatorio) Vincoli: Pattern = [a-zA-Z0-9_] |
OutputPathAssetReference
Nome | Descrizione | Valore |
---|---|---|
referenceType | [Obbligatorio] Specifica il tipo di riferimento all'asset. | "OutputPath" (obbligatorio) |
jobId | ID risorsa ARM del processo. | corda |
sentiero | Percorso del file o della directory nell'output del processo. | corda |
OnlineDeploymentProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
OnlineRequestSettings
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero di richieste consentite per accodare contemporaneamente per questa distribuzione. | Int |
maxQueueWait | Tempo di attesa massimo della coda nel formato ISO 8601. Supporta la precisione in millisecondi. | corda |
requestTimeout | Timeout della richiesta in formato ISO 8601. Supporta la precisione in millisecondi. | corda |
OnlineScaleSettings
AutoScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | "Auto" (obbligatorio) |
pollingInterval | Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. | corda |
targetUtilizationPercentage | Usare la CPU di destinazione per il ridimensionamento automatico. | Int |
ManualScaleSettings
Nome | Descrizione | Valore |
---|---|---|
scaleType | [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione | "Manuale" (obbligatorio) |
instanceCount | Numero fisso di istanze per questa distribuzione. | Int |
K8SOnlineDeployment
Nome | Descrizione | Valore |
---|---|---|
endpointComputeType | [Obbligatorio] Tipo di calcolo dell'endpoint. | "K8S" (obbligatorio) |
containerResourceRequirements | Requisiti delle risorse per ogni istanza di contenitore all'interno di una distribuzione online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrizione | Valore |
---|---|---|
CPU | Quantità minima di core CPU da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Quantità massima di core CPU che possono essere usati dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Numero di dispositivi PCIE FPGA esposti al contenitore. Deve essere multiplo di 2. | Int |
Gpu | Numero di core GPU nel contenitore. | Int |
memoryInGB | Quantità minima di memoria (in GB) da usare dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Quantità massima di memoria (in GB) consentita dal contenitore. Altre informazioni: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |