Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/inferencePools 2024-04-01-preview

Definizione di risorsa Bicep

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:

  • gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il bicep seguente al modello.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2024-04-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentConfiguration: {
      environmentId: 'string'
      environmentVariables: {
        {customized property}: 'string'
      }
      livenessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      readinessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      startupProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
    }
    modelConfiguration: {
      modelId: 'string'
    }
    nodeSkuType: 'string'
    properties: {
      {customized property}: 'string'
    }
    requestConfiguration: {
      maxConcurrentRequestsPerInstance: int
      requestTimeout: 'string'
    }
  }
}

Valori delle proprietà

workspaces/inferencePools

Nome Descrizione Valore
nome Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
Tag Tag di risorsa. Dizionario di nomi e valori di tag. Vedere tag nei modelli
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
genitore In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere risorsa figlio all'esterno della risorsa padre.
Nome simbolico per la risorsa di tipo: aree di lavoro
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
descrizione Descrizione della risorsa. corda
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàBaseProprietà
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. corda
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. corda

PropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione di risorsa del modello di Resource Manager

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:

  • gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
  "apiVersion": "2024-04-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentConfiguration": {
      "environmentId": "string",
      "environmentVariables": {
        "{customized property}": "string"
      },
      "livenessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "readinessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "startupProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      }
    },
    "modelConfiguration": {
      "modelId": "string"
    },
    "nodeSkuType": "string",
    "properties": {
      "{customized property}": "string"
    },
    "requestConfiguration": {
      "maxConcurrentRequestsPerInstance": "int",
      "requestTimeout": "string"
    }
  }
}

Valori delle proprietà

workspaces/inferencePools

Nome Descrizione Valore
digitare Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/inferencePools'
apiVersion Versione dell'API della risorsa '2024-04-01-preview'
nome Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in modelli DI Resource Manager JSON.
stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
Tag Tag di risorsa. Dizionario di nomi e valori di tag. Vedere tag nei modelli
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
descrizione Descrizione della risorsa. corda
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàBaseProprietà
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. corda
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. corda

PropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione di risorsa Terraform (provider AzAPI)

Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:

  • gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il seguente Terraform al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-04-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentConfiguration = {
        environmentId = "string"
        environmentVariables = {
          {customized property} = "string"
        }
        livenessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        readinessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        startupProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
      }
      modelConfiguration = {
        modelId = "string"
      }
      nodeSkuType = "string"
      properties = {
        {customized property} = "string"
      }
      requestConfiguration = {
        maxConcurrentRequestsPerInstance = int
        requestTimeout = "string"
      }
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Valori delle proprietà

workspaces/inferencePools

Nome Descrizione Valore
digitare Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-04-01-preview"
nome Nome della risorsa stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: aree di lavoro
Tag Tag di risorsa. Dizionario di nomi e valori di tag.
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. InferencePoolProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obbligatorio)
identity_ids Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. Matrice di ID identità utente.

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

InferencePoolProperties

Nome Descrizione Valore
codeConfiguration Configurazione del codice per il pool di inferenza. CodeConfiguration
descrizione Descrizione della risorsa. corda
environmentConfiguration EnvironmentConfiguration per il pool di inferenza. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration per il pool di inferenza. PoolModelConfiguration
nodeSkuType [Obbligatorio] Tipo di istanza di calcolo. stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. ProprietàBaseProprietà
requestConfiguration Richiedere la configurazione per il pool di inferenza. RequestConfiguration

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrizione Valore
environmentId ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. corda
environmentVariables Configurazione delle variabili di ambiente per il pool di inferenza. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
startupProbe In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

PoolModelConfiguration

Nome Descrizione Valore
modelId Percorso URI del modello. corda

PropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

RequestConfiguration

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. "Basic"
"Gratuito"
"Premium"
"Standard"