Aree di lavoro Microsoft.MachineLearningServices/inferencePools 2024-01-01-preview
- più recenti
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-08-01-preview
Definizione di risorsa Bicep
Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il bicep seguente al modello.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentConfiguration: {
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
startupProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
modelConfiguration: {
modelId: 'string'
}
nodeSkuType: 'string'
properties: {
{customized property}: 'string'
}
requestConfiguration: {
maxConcurrentRequestsPerInstance: int
requestTimeout: 'string'
}
}
}
Valori delle proprietà
workspaces/inferencePools
Nome | Descrizione | Valore |
---|---|---|
nome | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in Bicep. |
stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. Vedere tag nei modelli |
Sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | sku |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
genitore | In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre. Per altre informazioni, vedere risorsa figlio all'esterno della risorsa padre. |
Nome simbolico per la risorsa di tipo: aree di lavoro |
identità | Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) | ManagedServiceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | InferencePoolProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obbligatorio) |
userAssignedIdentities | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | userAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
InferencePoolProperties
Nome | Descrizione | Valore |
---|---|---|
codeConfiguration | Configurazione del codice per il pool di inferenza. | CodeConfiguration |
descrizione | Descrizione della risorsa. | corda |
environmentConfiguration | EnvironmentConfiguration per il pool di inferenza. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration per il pool di inferenza. | PoolModelConfiguration |
nodeSkuType | [Obbligatorio] Tipo di istanza di calcolo. | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | ProprietàBaseProprietà |
requestConfiguration | Richiedere la configurazione per il pool di inferenza. | RequestConfiguration |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nome | Descrizione | Valore |
---|---|---|
environmentId | ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. | corda |
environmentVariables | Configurazione delle variabili di ambiente per il pool di inferenza. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | Il probe di attività monitora regolarmente l'integrità del contenitore. | ProbeSettings |
readinessProbe | Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. | ProbeSettings |
startupProbe | In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
PoolModelConfiguration
Nome | Descrizione | Valore |
---|---|---|
modelId | Percorso URI del modello. | corda |
PropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
RequestConfiguration
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. | Int |
requestTimeout | Timeout di assegnazione dei punteggi in formato ISO 8601. Il valore predefinito è 5000 ms. |
corda |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. | Int |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. | corda |
nome | Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero | stringa (obbligatorio) |
grandezza | Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. | corda |
livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. | 'Basic' 'Free' 'Premium' 'Standard' |
Definizione di risorsa del modello di Resource Manager
Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il codice JSON seguente al modello.
{
"type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
"apiVersion": "2024-01-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentConfiguration": {
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"startupProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
},
"modelConfiguration": {
"modelId": "string"
},
"nodeSkuType": "string",
"properties": {
"{customized property}": "string"
},
"requestConfiguration": {
"maxConcurrentRequestsPerInstance": "int",
"requestTimeout": "string"
}
}
}
Valori delle proprietà
workspaces/inferencePools
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di risorsa | 'Microsoft.MachineLearningServices/workspaces/inferencePools' |
apiVersion | Versione dell'API della risorsa | '2024-01-01-preview' |
nome | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in modelli DI Resource Manager JSON. |
stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. Vedere tag nei modelli |
Sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | sku |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
identità | Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) | ManagedServiceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | InferencePoolProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | 'Nessuno' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obbligatorio) |
userAssignedIdentities | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | userAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
InferencePoolProperties
Nome | Descrizione | Valore |
---|---|---|
codeConfiguration | Configurazione del codice per il pool di inferenza. | CodeConfiguration |
descrizione | Descrizione della risorsa. | corda |
environmentConfiguration | EnvironmentConfiguration per il pool di inferenza. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration per il pool di inferenza. | PoolModelConfiguration |
nodeSkuType | [Obbligatorio] Tipo di istanza di calcolo. | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | ProprietàBaseProprietà |
requestConfiguration | Richiedere la configurazione per il pool di inferenza. | RequestConfiguration |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nome | Descrizione | Valore |
---|---|---|
environmentId | ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. | corda |
environmentVariables | Configurazione delle variabili di ambiente per il pool di inferenza. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | Il probe di attività monitora regolarmente l'integrità del contenitore. | ProbeSettings |
readinessProbe | Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. | ProbeSettings |
startupProbe | In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
PoolModelConfiguration
Nome | Descrizione | Valore |
---|---|---|
modelId | Percorso URI del modello. | corda |
PropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
RequestConfiguration
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. | Int |
requestTimeout | Timeout di assegnazione dei punteggi in formato ISO 8601. Il valore predefinito è 5000 ms. |
corda |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. | Int |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. | corda |
nome | Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero | stringa (obbligatorio) |
grandezza | Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. | corda |
livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. | 'Basic' 'Free' 'Premium' 'Standard' |
Definizione di risorsa Terraform (provider AzAPI)
Il tipo di risorsa workspaces/inferencePools può essere distribuito con operazioni destinate a:
- gruppi di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/inferencePools, aggiungere il seguente Terraform al modello.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentConfiguration = {
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
startupProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
modelConfiguration = {
modelId = "string"
}
nodeSkuType = "string"
properties = {
{customized property} = "string"
}
requestConfiguration = {
maxConcurrentRequestsPerInstance = int
requestTimeout = "string"
}
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Valori delle proprietà
workspaces/inferencePools
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di risorsa | "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview" |
nome | Nome della risorsa | stringa (obbligatorio) |
ubicazione | Posizione geografica in cui risiede la risorsa | stringa (obbligatorio) |
parent_id | ID della risorsa padre per questa risorsa. | ID per la risorsa di tipo: aree di lavoro |
Tag | Tag di risorsa. | Dizionario di nomi e valori di tag. |
Sku | Dettagli sku necessari per il contratto ARM per la scalabilità automatica. | sku |
gentile | Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. | corda |
identità | Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) | ManagedServiceIdentity |
proprietà | [Obbligatorio] Attributi aggiuntivi dell'entità. | InferencePoolProperties (obbligatorio) |
ManagedServiceIdentity
Nome | Descrizione | Valore |
---|---|---|
digitare | Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obbligatorio) |
identity_ids | Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. | Matrice di ID identità utente. |
UserAssignedIdentities
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | userAssignedIdentity |
UserAssignedIdentity
Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.
InferencePoolProperties
Nome | Descrizione | Valore |
---|---|---|
codeConfiguration | Configurazione del codice per il pool di inferenza. | CodeConfiguration |
descrizione | Descrizione della risorsa. | corda |
environmentConfiguration | EnvironmentConfiguration per il pool di inferenza. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration per il pool di inferenza. | PoolModelConfiguration |
nodeSkuType | [Obbligatorio] Tipo di istanza di calcolo. | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
proprietà | Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. | ProprietàBaseProprietà |
requestConfiguration | Richiedere la configurazione per il pool di inferenza. | RequestConfiguration |
CodeConfiguration
Nome | Descrizione | Valore |
---|---|---|
codeId | ID risorsa ARM dell'asset di codice. | corda |
punteggioScript | [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" | stringa (obbligatorio) Vincoli: Lunghezza minima = 1 Pattern = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nome | Descrizione | Valore |
---|---|---|
environmentId | ID risorsa ARM della specifica dell'ambiente per il pool di inferenza. | corda |
environmentVariables | Configurazione delle variabili di ambiente per il pool di inferenza. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | Il probe di attività monitora regolarmente l'integrità del contenitore. | ProbeSettings |
readinessProbe | Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. | ProbeSettings |
startupProbe | In questo modo viene verificato se l'applicazione all'interno di un contenitore viene avviata. I probe di avvio vengono eseguiti prima di qualsiasi altro probe e, a meno che non termini correttamente, disabilita altri probe. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
ProbeSettings
Nome | Descrizione | Valore |
---|---|---|
failureThreshold | Numero di errori da consentire prima di restituire uno stato non integro. | Int |
initialDelay | Ritardo prima del primo probe in formato ISO 8601. | corda |
periodo | Intervallo di tempo tra probe in formato ISO 8601. | corda |
successThreshold | Numero di probe riusciti prima di restituire uno stato integro. | Int |
Timeout | Timeout del probe in formato ISO 8601. | corda |
PoolModelConfiguration
Nome | Descrizione | Valore |
---|---|---|
modelId | Percorso URI del modello. | corda |
PropertiesBaseProperties
Nome | Descrizione | Valore |
---|---|---|
{proprietà personalizzata} | corda |
RequestConfiguration
Nome | Descrizione | Valore |
---|---|---|
maxConcurrentRequestsPerInstance | Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. | Int |
requestTimeout | Timeout di assegnazione dei punteggi in formato ISO 8601. Il valore predefinito è 5000 ms. |
corda |
Sku
Nome | Descrizione | Valore |
---|---|---|
capacità | Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. | Int |
famiglia | Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. | corda |
nome | Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero | stringa (obbligatorio) |
grandezza | Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. | corda |
livello | Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. | "Basic" "Gratuito" "Premium" "Standard" |