Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-10-01

Definizione di risorsa Bicep

Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il bicep seguente al modello.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Per Gestito, usare:

  endpointComputeType: 'Managed'

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Impostazione predefinita, usare:

  scaleType: 'Default'

Per TargetUtilization, usare:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valori delle proprietà

workspaces/onlineEndpoints/deployments

Nome Descrizione valore
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatorio)
posizione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
tags Tag delle risorse. Dizionario di nomi e valori di tag. Vedere Tag nei modelli
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
padre In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre.
Nome simbolico per la risorsa di tipo: onlineEndpoints
identity Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti i tipi SystemAssigned e UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un'uscita sicura. Impostazione predefinita: abilitata. 'Disabilitato'
'Enabled'
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. string
livenessProbe Il probe liveness monitora regolarmente l'integrità del contenitore. ProbeSettings
model Percorso URI del modello. string
modelMountPath Percorso per montare il modello nel contenitore personalizzato. string
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di conformità convalida se il contenitore è pronto per servire il traffico. Le proprietà e le impostazioni predefinite sono uguali al probe di livezza. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Ridimensionare le impostazioni per la distribuzione.
Se è null o non specificato,
impostazione predefinita per TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto Kubernetes
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste simultanee massime consentite per ogni nodo consentito per distribuzione. Assume il valore predefinito 1. INT
maxQueueWait L'intervallo massimo di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500ms.
string
requestTimeout Timeout di assegnazione dei punteggi nel formato ISO 8601.
Il valore predefinito è 5000ms.
string

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto Default
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Default' (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'TargetUtilization' (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota sarà riservata per max_instances. INT
minInstances Numero minimo di istanze da presentare sempre. INT
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. string
targetUtilizationPercentage Utilizzo della CPU di destinazione per il ridimensionamento automatico. INT

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Kubernetes' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite delle risorse contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
cpu Numero di richieste/limite di vCPUs per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Numero di schede GPU Nvidia richiesta/limite per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memoria Richiesta/limite delle dimensioni della memoria per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, l'intero della capacità deve essere incluso. Se la scalabilità orizzontale/in non è possibile per la risorsa, potrebbe essere omessa. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. string
name Il nome della SKU. Ex - P3. In genere è un codice lettera+numero stringa (obbligatoria)
size Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione della risorsa modello di Resource Manager

Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Per Managed, usare:

  "endpointComputeType": "Managed"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Impostazione predefinita, usare:

  "scaleType": "Default"

Per TargetUtilization, usare:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valori delle proprietà

aree di lavoro/onlineEndpoints/distribuzioni

Nome Descrizione Valore
tipo Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Versione dell'API risorsa '2023-10-01'
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio nei modelli di RESOURCE JSON.
stringa (obbligatoria)
posizione Posizione geografica in cui vive la risorsa stringa (obbligatoria)
tags Tag di risorse. Dizionario dei nomi e dei valori dei tag. Vedere Tag nei modelli
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. 'Disabilitato'
'Enabled'
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. string
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
model Percorso URI del modello. string
modelMountPath Percorso di montaggio del modello nel contenitore personalizzato. string
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di conformità verifica se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono le stesse del probe di attività. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Impostazioni di scalabilità per la distribuzione.
Se è null o non specificato,
il valore predefinito è TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto Kubernetes
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
punteggioScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe con esito positivo prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Assume il valore predefinito 1. INT
maxQueueWait La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500 ms.
string
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
string

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto Default
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Default' (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'TargetUtilization' (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. INT
minInstances Numero minimo di istanze da presentare sempre. INT
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione ridotta a secondi. string
targetUtilizationPercentage Usare la CPU di destinazione per il ridimensionamento automatico. INT

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Kubernetes' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite di risorse contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
cpu Numero di richieste/limiti di vCPU per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memoria Richiesta/limite di dimensioni della memoria per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, è possibile che venga omesso. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. string
name Il nome della SKU. Ex - P3. In genere è un codice lettera+numero stringa (obbligatoria)
size Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione della risorsa Terraform (provider AzAPI)

Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:

  • Gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice Terraform seguente al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Per Managed, usare:

  endpointComputeType = "Managed"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Impostazione predefinita, usare:

  scaleType = "Default"

Per TargetUtilization, usare:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valori delle proprietà

aree di lavoro/onlineEndpoints/distribuzioni

Nome Descrizione Valore
tipo Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
name Nome della risorsa stringa (obbligatoria)
posizione Posizione geografica in cui vive la risorsa stringa (obbligatoria)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: onlineEndpoints
tags Tag di risorse. Dizionario dei nomi e dei valori dei tag.
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obbligatorio)
identity_ids Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. Matrice di ID identità utente.

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un'uscita sicura. Impostazione predefinita: abilitata. "Disabilitato"
"Abilitato"
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. string
livenessProbe Il probe liveness monitora regolarmente l'integrità del contenitore. ProbeSettings
model Percorso URI del modello. string
modelMountPath Percorso per montare il modello nel contenitore personalizzato. string
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di conformità convalida se il contenitore è pronto per servire il traffico. Le proprietà e le impostazioni predefinite sono uguali al probe di livezza. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Ridimensionare le impostazioni per la distribuzione.
Se è null o non specificato,
impostazione predefinita per TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto Kubernetes
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Assume il valore predefinito 1. INT
maxQueueWait La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500 ms.
string
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
string

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto Default
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione "Default" (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione "TargetUtilization" (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. INT
minInstances Numero minimo di istanze da presentare sempre. INT
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione ridotta a secondi. string
targetUtilizationPercentage Usare la CPU di destinazione per il ridimensionamento automatico. INT

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "Kubernetes" (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite di risorse contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
cpu Numero di richieste/limiti di vCPU per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memoria Richiesta/limite di dimensioni della memoria per il contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "Gestito" (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, è possibile che venga omesso. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. string
name Il nome della SKU. Ex - P3. In genere è un codice lettera+numero stringa (obbligatoria)
size Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. "Basic"
"Gratuito"
"Premium"
"Standard"