Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview

Definizione di risorsa Bicep

Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il modello Bicep seguente.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
}

Oggetti OnlineDeployment

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per K8S, usare:

  endpointComputeType: 'K8S'
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }

Per Managed, usare:

  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }

Oggetti AssetReferenceBase

Impostare la proprietà referenceType per specificare il tipo di oggetto.

Per DataPath, usare:

  referenceType: 'DataPath'
  datastoreId: 'string'
  path: 'string'

Per ID, usare:

  referenceType: 'Id'
  assetId: 'string'

Per OutputPath, usare:

  referenceType: 'OutputPath'
  jobId: 'string'
  path: 'string'

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Auto, usare:

  scaleType: 'Auto'
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Per Manuale, usare:

  scaleType: 'Manual'
  instanceCount: int

Valori delle proprietà

aree di lavoro/onlineEndpoints/distribuzioni

Nome Descrizione valore
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatoria)
posizione Posizione geografica in cui vive la risorsa stringa (obbligatoria)
tags Tag di risorse. Dizionario dei nomi e dei valori dei tag. Vedere Tag nei modelli
kind Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
padre In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre.
Nome simbolico per la risorsa di tipo: onlineEndpoints
identity Identità del servizio associata a una risorsa. ResourceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeployment (obbligatorio)

ResourceIdentity

Nome Descrizione Valore
tipo Definisce i valori per il tipo di ResourceIdentity. 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'
userAssignedIdentities Dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrizione Valore
clientId ID applicazione aka, un identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. string
principalId ID oggetto dell'oggetto dell'entità servizio per l'identità gestita usata per concedere l'accesso basato sul ruolo a una risorsa di Azure. string

OnlineDeployment

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
environmentId ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. OnlineDeploymentEnvironmentVariables
livenessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings
model Riferimento all'asset del modello per la distribuzione dell'endpoint. AssetReferenceBase
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. OnlineDeploymentProperties
requestSettings Configurazione delle richieste di assegnazione dei punteggi della distribuzione online. OnlineRequestSettings
scaleSettings Configurazione del ridimensionamento della distribuzione online. OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto K8S
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

AssetReferenceBase

Nome Descrizione Valore
referenceType Impostare il tipo di oggetto DataPath
Id
OutputPath (obbligatorio)

DataPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'DataPath' (obbligatorio)
datastoreId ID risorsa ARM dell'archivio dati in cui si trova l'asset. string
path Percorso del file/directory nell'archivio dati. string

IdAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'ID' (obbligatorio)
assetId [Obbligatorio] ID risorsa ARM dell'asset. stringa (obbligatoria)

Vincoli:
Pattern = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'OutputPath' (obbligatorio)
jobId ID risorsa ARM del processo. string
path Percorso del file/directory nell'output del processo. string

OnlineDeploymentProperties

Nome Descrizione Valore
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste consentite per la coda contemporaneamente per questa distribuzione. INT
maxQueueWait Tempo di attesa della coda massimo nel formato ISO 8601. Supporta la precisione milliseconda. string
requestTimeout Timeout della richiesta in formato ISO 8601. Supporta la precisione milliseconda. string

OnlineScaleSettings

Nome Descrizione Valore
maxInstances Numero massimo di istanze per questa distribuzione. INT
minInstances Numero minimo di istanze per questa distribuzione. INT
scaleType Impostare il tipo di oggetto Auto
Manuale (obbligatorio)

AutoScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Auto' (obbligatorio)
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. string
targetUtilizationPercentage Utilizzo della CPU di destinazione per il ridimensionamento automatico. INT

ManualScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Manuale' (obbligatorio)
instanceCount Numero fisso di istanze per questa distribuzione. INT

K8SOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'K8S' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per ogni istanza del contenitore all'interno di una distribuzione online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
cpu Quantità minima di core CPU da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
cpuLimit Quantità massima di core CPU che possono essere usati dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
Fpga Numero di dispositivi PCIE FPGA esposti al contenitore. Deve essere multiplo di 2. INT
Gpu Numero di core GPU nel contenitore. INT
memoryInGB Quantità minima di memoria (in GB) da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
memoryInGBLimit Quantità massima di memoria (in GB) consentita dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)
instanceType Tipo di istanza di calcolo. string
readinessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings

Definizione di risorsa del modello di Resource Manager

Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  }
}

Oggetti OnlineDeployment

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per K8S, usare:

  "endpointComputeType": "K8S",
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  }

Per Gestito, usare:

  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }

Oggetti AssetReferenceBase

Impostare la proprietà referenceType per specificare il tipo di oggetto.

Per DataPath, usare:

  "referenceType": "DataPath",
  "datastoreId": "string",
  "path": "string"

Per ID, usare:

  "referenceType": "Id",
  "assetId": "string"

Per OutputPath usare:

  "referenceType": "OutputPath",
  "jobId": "string",
  "path": "string"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Auto usare:

  "scaleType": "Auto",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Per Manuale, usare:

  "scaleType": "Manual",
  "instanceCount": "int"

Valori delle proprietà

workspaces/onlineEndpoints/deployments

Nome Descrizione Valore
tipo Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Versione dell'API della risorsa '2021-03-01-preview'
name Nome della risorsa

Informazioni su come impostare nomi e tipi per le risorse figlio nei modelli di Resource Manager JSON.
stringa (obbligatorio)
posizione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
tags Tag delle risorse. Dizionario di nomi e valori di tag. Vedere Tag nei modelli
kind Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio associata a una risorsa. ResourceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeployment (obbligatorio)

ResourceIdentity

Nome Descrizione Valore
tipo Definisce i valori per il tipo di ResourceIdentity. 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'
userAssignedIdentities Il dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'interfaccia utente. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrizione Valore
clientId ID applicazione noto anche come ID applicazione, identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. string
principalId ID oggetto dell'oggetto entità servizio per l'identità gestita usata per concedere l'accesso in base al ruolo a una risorsa di Azure. string

OnlineDeployment

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
environmentId ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. OnlineDeploymentEnvironmentVariables
livenessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings
model Riferimento all'asset del modello per la distribuzione dell'endpoint. AssetReferenceBase
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. OnlineDeploymentProperties
requestSettings Configurazione delle richieste di assegnazione dei punteggi per la distribuzione online. OnlineRequestSettings
scaleSettings Configurazione del ridimensionamento della distribuzione online. OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto K8S
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
punteggioScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe con esito positivo prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

AssetReferenceBase

Nome Descrizione Valore
referenceType Impostare il tipo di oggetto DataPath
Id
OutputPath (obbligatorio)

DataPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'DataPath' (obbligatorio)
datastoreId ID risorsa ARM dell'archivio dati in cui si trova l'asset. string
path Percorso del file/directory nell'archivio dati. string

IdAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'ID' (obbligatorio)
assetId [Obbligatorio] ID risorsa ARM dell'asset. stringa (obbligatoria)

Vincoli:
Pattern = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. 'OutputPath' (obbligatorio)
jobId ID risorsa ARM del processo. string
path Percorso del file/directory nell'output del processo. string

OnlineDeploymentProperties

Nome Descrizione Valore
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste consentite per la coda contemporaneamente per questa distribuzione. INT
maxQueueWait Tempo di attesa della coda massimo nel formato ISO 8601. Supporta la precisione milliseconda. string
requestTimeout Timeout della richiesta in formato ISO 8601. Supporta la precisione milliseconda. string

OnlineScaleSettings

Nome Descrizione Valore
maxInstances Numero massimo di istanze per questa distribuzione. INT
minInstances Numero minimo di istanze per questa distribuzione. INT
scaleType Impostare il tipo di oggetto Auto
Manuale (obbligatorio)

AutoScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Auto' (obbligatorio)
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. string
targetUtilizationPercentage Utilizzo della CPU di destinazione per il ridimensionamento automatico. INT

ManualScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione 'Manuale' (obbligatorio)
instanceCount Numero fisso di istanze per questa distribuzione. INT

K8SOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'K8S' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per ogni istanza del contenitore all'interno di una distribuzione online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
cpu Quantità minima di core CPU da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
cpuLimit Quantità massima di core CPU consentiti per l'uso dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
Fpga Numero di dispositivi FPGA PCIE esposti al contenitore. Deve essere più di 2. INT
Gpu Numero di core GPU nel contenitore. INT
memoryInGB Quantità minima di memoria (in GB) da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
memoryInGBLimit La quantità massima di memoria (in GB) può essere usata dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)
instanceType Tipo di istanza di calcolo. string
readinessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings

Definizione della risorsa Terraform (provider AzAPI)

Il tipo di risorsa aree di lavoro/onlineEndpoints/distribuzioni può essere distribuito con operazioni destinate:

  • Gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice Terraform seguente al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
    kind = "string"
  })
}

Oggetti OnlineDeployment

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per K8S, usare:

  endpointComputeType = "K8S"
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }

Per Managed, usare:

  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }

Oggetti AssetReferenceBase

Impostare la proprietà referenceType per specificare il tipo di oggetto.

Per DataPath, usare:

  referenceType = "DataPath"
  datastoreId = "string"
  path = "string"

Per ID, usare:

  referenceType = "Id"
  assetId = "string"

Per OutputPath, usare:

  referenceType = "OutputPath"
  jobId = "string"
  path = "string"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per Auto, usare:

  scaleType = "Auto"
  pollingInterval = "string"
  targetUtilizationPercentage = int

Per Manuale, usare:

  scaleType = "Manual"
  instanceCount = int

Valori delle proprietà

aree di lavoro/onlineEndpoints/distribuzioni

Nome Descrizione Valore
tipo Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name Nome della risorsa stringa (obbligatoria)
posizione Posizione geografica in cui vive la risorsa stringa (obbligatoria)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: onlineEndpoints
tags Tag di risorse. Dizionario dei nomi e dei valori dei tag.
kind Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio associata a una risorsa. ResourceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeployment (obbligatorio)

ResourceIdentity

Nome Descrizione Valore
tipo Definisce i valori per il tipo di ResourceIdentity. "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
identity_ids Dizionario delle identità assegnate dall'utente, la chiave è l'ID risorsa ARM dell'UAI. Matrice di ID identità utente.

ResourceIdentityUserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nome Descrizione Valore
clientId ID applicazione aka, un identificatore univoco generato da Azure AD associato a un'applicazione e a un'entità servizio durante il provisioning iniziale. string
principalId ID oggetto dell'oggetto dell'entità servizio per l'identità gestita usata per concedere l'accesso basato sul ruolo a una risorsa di Azure. string

OnlineDeployment

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
description Descrizione della distribuzione dell'endpoint. string
environmentId ID risorsa ARM della specifica dell'ambiente per la distribuzione dell'endpoint. string
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. OnlineDeploymentEnvironmentVariables
livenessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings
model Riferimento all'asset del modello per la distribuzione dell'endpoint. AssetReferenceBase
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. OnlineDeploymentProperties
requestSettings Configurazione delle richieste di assegnazione dei punteggi della distribuzione online. OnlineRequestSettings
scaleSettings Configurazione del ridimensionamento della distribuzione online. OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto K8S
Gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

AssetReferenceBase

Nome Descrizione Valore
referenceType Impostare il tipo di oggetto DataPath
Id
OutputPath (obbligatorio)

DataPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. "DataPath" (obbligatorio)
datastoreId ID risorsa ARM dell'archivio dati in cui si trova l'asset. string
path Percorso del file/directory nell'archivio dati. string

IdAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. "ID" (obbligatorio)
assetId [Obbligatorio] ID risorsa ARM dell'asset. stringa (obbligatoria)

Vincoli:
Pattern = [a-zA-Z0-9_]

OutputPathAssetReference

Nome Descrizione Valore
referenceType [Obbligatorio] Specifica il tipo di riferimento dell'asset. "OutputPath" (obbligatorio)
jobId ID risorsa ARM del processo. string
path Percorso del file/directory nell'output del processo. string

OnlineDeploymentProperties

Nome Descrizione Valore
{proprietà personalizzata} string

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste consentite per la coda contemporaneamente per questa distribuzione. INT
maxQueueWait Tempo di attesa della coda massimo nel formato ISO 8601. Supporta la precisione milliseconda. string
requestTimeout Timeout della richiesta in formato ISO 8601. Supporta la precisione milliseconda. string

OnlineScaleSettings

Nome Descrizione Valore
maxInstances Numero massimo di istanze per questa distribuzione. INT
minInstances Numero minimo di istanze per questa distribuzione. INT
scaleType Impostare il tipo di oggetto Auto
Manuale (obbligatorio)

AutoScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione "Auto" (obbligatorio)
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. string
targetUtilizationPercentage Utilizzo della CPU di destinazione per il ridimensionamento automatico. INT

ManualScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di scalabilità della distribuzione "Manuale" (obbligatorio)
instanceCount Numero fisso di istanze per questa distribuzione. INT

K8SOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "K8S" (obbligatorio)
containerResourceRequirements Requisiti delle risorse per ogni istanza del contenitore all'interno di una distribuzione online. ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
cpu Quantità minima di core CPU da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
cpuLimit Quantità massima di core CPU che possono essere usati dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
Fpga Numero di dispositivi PCIE FPGA esposti al contenitore. Deve essere multiplo di 2. INT
Gpu Numero di core GPU nel contenitore. INT
memoryInGB Quantità minima di memoria (in GB) da usare dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT
memoryInGBLimit Quantità massima di memoria (in GB) consentita dal contenitore. Per altre informazioni, vedere:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
INT

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "Gestito" (obbligatorio)
instanceType Tipo di istanza di calcolo. string
readinessProbe Configurazione del probe di disponibilità/conformità del contenitore di distribuzione. ProbeSettings