AksServiceDeploymentConfiguration Classe

Rappresenta le informazioni di configurazione della distribuzione per un servizio distribuito nel servizio Azure Kubernetes.

Creare un oggetto AksServiceDeploymentConfiguration usando il deploy_configuration metodo della AksWebservice classe .

Inizializzare un oggetto di configurazione per la distribuzione in una destinazione di calcolo del servizio Azure Kubernetes.

Costruttore

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametri

Nome	Descrizione
cpu_cores_limit Necessario	È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.
memory_gb_limit Necessario	La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale.
autoscale_enabled Necessario	bool Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se `num_replicas` non è Nessuno.
autoscale_min_replicas Necessario	int Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1.
autoscale_max_replicas Necessario	int Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10
autoscale_refresh_seconds Necessario	int Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1.
autoscale_target_utilization Necessario	int L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.
collect_model_data Necessario	bool Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.
auth_enabled Necessario	bool Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.
cpu_cores Necessario	float Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1
memory_gb Necessario	float Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5
enable_app_insights Necessario	bool Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
scoring_timeout_ms Necessario	int Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
replica_max_concurrent_requests Necessario	int Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
max_request_wait_time Necessario	int La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
num_replicas Necessario	int Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.
primary_key Necessario	str Chiave di autenticazione primaria da usare per questo servizio Web.
secondary_key Necessario	str Chiave di autenticazione secondaria da usare per questo servizio Web.
tags Necessario	dict[str, str] Dizionario di tag chiave-valore per assegnare questo servizio Web.
properties Necessario	dict[str, str] Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.
description Necessario	str Descrizione da assegnare a questo servizio Web.
gpu_cores Necessario	int Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
period_seconds Necessario	int La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
initial_delay_seconds Necessario	int Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
timeout_seconds Necessario	int Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.
success_threshold Necessario	int Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1.
failure_threshold Necessario	int Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà `failureThreshold` i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
namespace Necessario	str Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.
token_auth_enabled Necessario	bool Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.
cpu_cores_limit Necessario	È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.
memory_gb_limit Necessario	La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale.
blobfuse_enabled	bool Indica se abilitare o meno blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True Valore predefinito: None
autoscale_enabled Necessario	bool Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se `num_replicas` non è Nessuno.
autoscale_min_replicas Necessario	int Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1.
autoscale_max_replicas Necessario	int Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10
autoscale_refresh_seconds Necessario	int Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1.
autoscale_target_utilization Necessario	int L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.
collect_model_data Necessario	bool Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.
auth_enabled Necessario	bool Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.
cpu_cores Necessario	float Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1
memory_gb Necessario	float Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5
enable_app_insights Necessario	bool Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
scoring_timeout_ms Necessario	int Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
replica_max_concurrent_requests Necessario	int Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
max_request_wait_time Necessario	int La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
num_replicas Necessario	int Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.
primary_key Necessario	str Chiave di autenticazione primaria da usare per questo servizio Web.
secondary_key Necessario	str Chiave di autenticazione secondaria da usare per questo servizio Web.
tags Necessario	dict[str, str] Dizionario di tag chiave-valore per assegnare questo servizio Web.
properties Necessario	dict[str, str] Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.
description Necessario	str Descrizione da assegnare a questo servizio Web.
gpu_cores Necessario	int Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
period_seconds Necessario	int La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
initial_delay_seconds Necessario	int Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
timeout_seconds Necessario	int Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.
success_threshold Necessario	int Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1.
failure_threshold Necessario	int Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà `failureThreshold` i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
namespace Necessario	str Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.
token_auth_enabled Necessario	bool Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.
compute_target_name Necessario	str Nome della destinazione di calcolo in cui eseguire la distribuzione
cpu_cores_limit Necessario	float È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.
memory_gb_limit Necessario	float La quantità massima di memoria (in GB) consentita per questo servizio Web. Può essere un decimale.
blobfuse_enabled Necessario	bool Indica se abilitare o meno blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True

Variabili

Nome	Descrizione
autoscale_enabled	bool Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se `num_replicas` non è Nessuno.
autoscale_min_replicas	int Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 1.
autoscale_max_replicas	int Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10
autoscale_refresh_seconds	int Frequenza con cui il ridimensionamento automatico deve tentare di ridimensionare questo servizio Web. Il valore predefinito è 1.
autoscale_target_utilization	int L'utilizzo di destinazione (in percentuale su 100) del ridimensionamento automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.
collect_model_data	bool Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.
auth_enabled	bool Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.
cpu_cores	float Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1
memory_gb	float Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5
enable_app_insights	bool Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
scoring_timeout_ms	int Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
replica_max_concurrent_requests	int Numero massimo di richieste simultanee per replica da consentire per questo servizio Web. Il valore predefinito è 1. Non modificare questa impostazione dal valore predefinito 1 a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
max_request_wait_time	int La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
num_replicas	int Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.
primary_key	str Chiave di autenticazione primaria da usare per questo servizio Web.
secondary_key	str Chiave di autenticazione secondaria da usare per questo servizio Web.
azureml.core.webservice.AksServiceDeploymentConfiguration.tags	Dizionario di tag chiave-valore per assegnare questo servizio Web.
azureml.core.webservice.AksServiceDeploymentConfiguration.properties	Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.
azureml.core.webservice.AksServiceDeploymentConfiguration.description	Descrizione da assegnare a questo servizio Web.
gpu_cores	int Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
period_seconds	int La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
initial_delay_seconds	int Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
timeout_seconds	int Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.
success_threshold	int Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Il valore predefinito è 1. Il valore minimo è 1.
failure_threshold	int Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà `failureThreshold` i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace	Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.
token_auth_enabled	bool Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

Metodi

print_deploy_configuration

Stampare la configurazione della distribuzione.

validate_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

print_deploy_configuration

Stampare la configurazione della distribuzione.

print_deploy_configuration()

validate_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

validate_configuration()

Eccezioni

Tipo	Descrizione
WebserviceException

Commenti e suggerimenti

Questa pagina è stata utile?

Condividi tramite

AksServiceDeploymentConfiguration Classe

Costruttore

Parametri

Variabili

Metodi

print_deploy_configuration

validate_configuration

Eccezioni

Commenti e suggerimenti