AksServiceDeploymentConfiguration Classe
Rappresenta le informazioni di configurazione della distribuzione per un servizio distribuito nel servizio Azure Kubernetes.
Creare un oggetto AksServiceDeploymentConfiguration usando il deploy_configuration metodo della AksWebservice classe .
Inizializzare un oggetto di configurazione per la distribuzione in una destinazione di calcolo del servizio Azure Kubernetes.
Costruttore
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parametri
| Nome | Descrizione |
|---|---|
|
cpu_cores_limit
Necessario
|
È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale. |
|
memory_gb_limit
Necessario
|
La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale. |
|
autoscale_enabled
Necessario
|
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se |
|
autoscale_min_replicas
Necessario
|
Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1. |
|
autoscale_max_replicas
Necessario
|
Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10 |
|
autoscale_refresh_seconds
Necessario
|
Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1. |
|
autoscale_target_utilization
Necessario
|
L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70. |
|
collect_model_data
Necessario
|
Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False. |
|
auth_enabled
Necessario
|
Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True. |
|
cpu_cores
Necessario
|
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1 |
|
memory_gb
Necessario
|
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5 |
|
enable_app_insights
Necessario
|
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False |
|
scoring_timeout_ms
Necessario
|
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000. |
|
replica_max_concurrent_requests
Necessario
|
Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning. |
|
max_request_wait_time
Necessario
|
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500. |
|
num_replicas
Necessario
|
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita. |
|
primary_key
Necessario
|
Chiave di autenticazione primaria da usare per questo servizio Web. |
|
secondary_key
Necessario
|
Chiave di autenticazione secondaria da usare per questo servizio Web. |
|
tags
Necessario
|
Dizionario di tag chiave-valore per assegnare questo servizio Web. |
|
properties
Necessario
|
Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore. |
|
description
Necessario
|
Descrizione da assegnare a questo servizio Web. |
|
gpu_cores
Necessario
|
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0. |
|
period_seconds
Necessario
|
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1. |
|
initial_delay_seconds
Necessario
|
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310. |
|
timeout_seconds
Necessario
|
Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1. |
|
success_threshold
Necessario
|
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1. |
|
failure_threshold
Necessario
|
Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà |
|
namespace
Necessario
|
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini. |
|
token_auth_enabled
Necessario
|
Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False. |
|
cpu_cores_limit
Necessario
|
È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale. |
|
memory_gb_limit
Necessario
|
La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale. |
|
blobfuse_enabled
|
Indica se abilitare o meno blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True Valore predefinito: None
|
|
autoscale_enabled
Necessario
|
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se |
|
autoscale_min_replicas
Necessario
|
Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1. |
|
autoscale_max_replicas
Necessario
|
Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10 |
|
autoscale_refresh_seconds
Necessario
|
Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1. |
|
autoscale_target_utilization
Necessario
|
L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70. |
|
collect_model_data
Necessario
|
Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False. |
|
auth_enabled
Necessario
|
Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True. |
|
cpu_cores
Necessario
|
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1 |
|
memory_gb
Necessario
|
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5 |
|
enable_app_insights
Necessario
|
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False |
|
scoring_timeout_ms
Necessario
|
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000. |
|
replica_max_concurrent_requests
Necessario
|
Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning. |
|
max_request_wait_time
Necessario
|
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500. |
|
num_replicas
Necessario
|
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita. |
|
primary_key
Necessario
|
Chiave di autenticazione primaria da usare per questo servizio Web. |
|
secondary_key
Necessario
|
Chiave di autenticazione secondaria da usare per questo servizio Web. |
|
tags
Necessario
|
Dizionario di tag chiave-valore per assegnare questo servizio Web. |
|
properties
Necessario
|
Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore. |
|
description
Necessario
|
Descrizione da assegnare a questo servizio Web. |
|
gpu_cores
Necessario
|
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0. |
|
period_seconds
Necessario
|
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1. |
|
initial_delay_seconds
Necessario
|
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310. |
|
timeout_seconds
Necessario
|
Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1. |
|
success_threshold
Necessario
|
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1. |
|
failure_threshold
Necessario
|
Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà |
|
namespace
Necessario
|
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini. |
|
token_auth_enabled
Necessario
|
Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False. |
|
compute_target_name
Necessario
|
Nome della destinazione di calcolo in cui eseguire la distribuzione |
|
cpu_cores_limit
Necessario
|
È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale. |
|
memory_gb_limit
Necessario
|
La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale. |
|
blobfuse_enabled
Necessario
|
Indica se abilitare o meno blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True |
Variabili
| Nome | Descrizione |
|---|---|
|
autoscale_enabled
|
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se |
|
autoscale_min_replicas
|
Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1. |
|
autoscale_max_replicas
|
Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10 |
|
autoscale_refresh_seconds
|
Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1. |
|
autoscale_target_utilization
|
L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70. |
|
collect_model_data
|
Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False. |
|
auth_enabled
|
Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True. |
|
cpu_cores
|
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1 |
|
memory_gb
|
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5 |
|
enable_app_insights
|
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False |
|
scoring_timeout_ms
|
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000. |
|
replica_max_concurrent_requests
|
Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning. |
|
max_request_wait_time
|
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500. |
|
num_replicas
|
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita. |
|
primary_key
|
Chiave di autenticazione primaria da usare per questo servizio Web. |
|
secondary_key
|
Chiave di autenticazione secondaria da usare per questo servizio Web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Dizionario di tag chiave-valore per assegnare questo servizio Web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Descrizione da assegnare a questo servizio Web. |
|
gpu_cores
|
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0. |
|
period_seconds
|
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1. |
|
initial_delay_seconds
|
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310. |
|
timeout_seconds
|
Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1. |
|
success_threshold
|
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1. |
|
failure_threshold
|
Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini. |
|
token_auth_enabled
|
Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False. |
Metodi
| print_deploy_configuration |
Stampare la configurazione della distribuzione. |
| validate_configuration |
Verificare che i valori di configurazione specificati siano validi. Genererà un'eccezione WebserviceException se la convalida non riesce. |
print_deploy_configuration
Stampare la configurazione della distribuzione.
print_deploy_configuration()
validate_configuration
Verificare che i valori di configurazione specificati siano validi.
Genererà un'eccezione WebserviceException se la convalida non riesce.
validate_configuration()
Eccezioni
| Tipo | Descrizione |
|---|---|