Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/inferencePools 2023-08-01-preview

Definizione di risorsa Bicep

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il modello Bicep seguente.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentConfiguration: {
      environmentId: 'string'
      environmentVariables: {
        {customized property}: 'string'
      }
      livenessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      readinessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      startupProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
    }
    modelConfiguration: {
      modelId: 'string'
    }
    nodeSkuType: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
      {customized property}: 'string'
    }
    requestConfiguration: {
      maxConcurrentRequestsPerInstance: int
      requestTimeout: 'string'
    }
  }
}

Valori delle proprietà

aree di lavoro/inferenzaPools

Nome Descrizione valore
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatoria)
posizione Posizione geografica in cui vive la risorsa stringa (obbligatoria)
tags Tag di risorse. Dizionario dei nomi e dei valori dei tag. Vedere Tag nei modelli
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale/strumenti/ecc per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
padre In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre.
Nome simbolico per la risorsa di tipo: aree di lavoro
identity Identità del servizio gestita (identità assegnata dal sistema e/o assegnata dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno id risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
description Descrizione della risorsa. string
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàBase
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. string
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe liveness monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di conformità convalida se il contenitore è pronto per servire il traffico. Le proprietà e le impostazioni predefinite sono uguali al probe di livezza. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non venga completato correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. string

ProprietàBase

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string
{proprietà personalizzata} string

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste simultanee massime consentite per ogni nodo consentito per distribuzione. Assume il valore predefinito 1. INT
requestTimeout Timeout di assegnazione dei punteggi nel formato ISO 8601.
Il valore predefinito è 5000ms.
string

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, l'intero della capacità deve essere incluso. Se la scalabilità orizzontale/in non è possibile per la risorsa, potrebbe essere omessa. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. string
name Il nome della SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
size Dimensioni dello SKU. Quando il campo name è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un put. 'Basic'
'Free'
'Premium'
'Standard'

Definizione di risorsa del modello di Resource Manager

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
  "apiVersion": "2023-08-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentConfiguration": {
      "environmentId": "string",
      "environmentVariables": {
        "{customized property}": "string"
      },
      "livenessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "readinessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "startupProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      }
    },
    "modelConfiguration": {
      "modelId": "string"
    },
    "nodeSkuType": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "requestConfiguration": {
      "maxConcurrentRequestsPerInstance": "int",
      "requestTimeout": "string"
    }
  }
}

Valori delle proprietà

workspaces/inferencePools

Nome Descrizione Valore
tipo Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/inferencePools'
apiVersion Versione dell'API della risorsa '2023-08-01-preview'
name Nome della risorsa

Informazioni su come impostare nomi e tipi per le risorse figlio nei modelli di Resource Manager JSON.
stringa (obbligatorio)
posizione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
tags Tag delle risorse. Dizionario di nomi e valori di tag. Vedere Tag nei modelli
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti i tipi SystemAssigned e UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
description Descrizione della risorsa. string
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàBase
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
assegnazione dei punteggiScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatoria)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. string
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe liveness monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di conformità convalida se il contenitore è pronto per servire il traffico. Le proprietà e le impostazioni predefinite sono uguali al probe di livezza. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non venga completato correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe riusciti prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. string

ProprietàBase

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string
{proprietà personalizzata} string

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero di richieste simultanee massime consentite per ogni nodo consentito per distribuzione. Assume il valore predefinito 1. INT
requestTimeout Timeout di assegnazione dei punteggi nel formato ISO 8601.
Il valore predefinito è 5000ms.
string

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, è possibile che venga omesso. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, può essere acquisito qui. string
name Il nome della SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
size Dimensioni dello SKU. Quando il campo name è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un put. 'Basic'
'Free'
'Premium'
'Standard'

Definizione della risorsa Terraform (provider AzAPI)

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate:

  • Gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il codice Terraform seguente al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentConfiguration = {
        environmentId = "string"
        environmentVariables = {
          {customized property} = "string"
        }
        livenessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        readinessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        startupProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
      }
      modelConfiguration = {
        modelId = "string"
      }
      nodeSkuType = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
        {customized property} = "string"
      }
      requestConfiguration = {
        maxConcurrentRequestsPerInstance = int
        requestTimeout = "string"
      }
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Valori delle proprietà

workspaces/inferencePools

Nome Descrizione Valore
tipo Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview"
name Nome della risorsa stringa (obbligatorio)
posizione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: aree di lavoro
tags Tag delle risorse. Dizionario di nomi e valori di tag.
sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. Sku
kind Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. string
identity Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
properties [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
tipo Tipo di identità del servizio gestito (in cui sono consentiti i tipi SystemAssigned e UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obbligatorio)
identity_ids Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. Matrice di ID identità utente.

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} UserAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
description Descrizione della risorsa. string
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
properties Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàProprietà
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. string
punteggioScript [Obbligatorio] Script da eseguire all'avvio. Ad esempio: "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. string
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di conformità verifica se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono le stesse del probe di attività. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore è stata avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} string

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. INT
initialDelay Ritardo prima del primo probe in formato ISO 8601. string
period Intervallo di tempo tra probe in formato ISO 8601. string
successThreshold Numero di probe con esito positivo prima di restituire uno stato integro. INT
timeout Timeout del probe in formato ISO 8601. string

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. string

ProprietàProprietà

Nome Descrizione Valore
{proprietà personalizzata} string
{proprietà personalizzata} string
{proprietà personalizzata} string

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Assume il valore predefinito 1. INT
requestTimeout Timeout di assegnazione dei punteggi nel formato ISO 8601.
Il valore predefinito è 5000ms.
string

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta la scalabilità orizzontale/in, l'intero della capacità deve essere incluso. Se la scalabilità orizzontale/in non è possibile per la risorsa, potrebbe essere omessa. INT
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. string
name Il nome della SKU. Ex - P3. In genere è un codice lettera+numero stringa (obbligatoria)
size Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. string
Livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più livelli, ma non è necessario in un PUT. "Basic"
"Gratuito"
"Premium"
"Standard"