AksServiceDeploymentConfiguration Classe
Rappresenta le informazioni di configurazione della distribuzione per un servizio distribuito in servizio Azure Kubernetes.
Creare un oggetto AksServiceDeploymentConfiguration usando il deploy_configuration
metodo della AksWebservice classe .
Inizializzare un oggetto di configurazione per la distribuzione in una destinazione di calcolo del servizio Azure Kubernetes.
- Ereditarietà
-
AksServiceDeploymentConfiguration
Costruttore
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parametri
- cpu_cores_limit
Il numero massimo di core cpu che questo servizio Web può usare. Può essere un decimale.
- memory_gb_limit
La quantità massima di memoria (in GB) di questo servizio Web è consentita per l'uso. Può essere un decimale.
- autoscale_enabled
- bool
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se num_replicas
non è Nessuno.
- autoscale_min_replicas
- int
Numero minimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.
- autoscale_max_replicas
- int
Numero massimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Impostazione predefinita su 10
- autoscale_refresh_seconds
- int
Frequenza con cui il ridimensionatore automatico deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.
- autoscale_target_utilization
- int
L'utilizzo di destinazione (in percentuale superiore a 100) il ridimensionatore automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.
- collect_model_data
- bool
Indica se abilitare o meno la raccolta dati del modello per questo servizio Web. Il valore predefinito è False.
- auth_enabled
- bool
Indica se abilitare l'autenticazione per questo servizio Web. Impostazione predefinita su True.
- cpu_cores
- float
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0.1
- memory_gb
- float
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0,5
- enable_app_insights
- bool
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
- scoring_timeout_ms
- int
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
- replica_max_concurrent_requests
- int
Numero di richieste simultanee massime per replica per consentire questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito di 1 a meno che non sia stato indicato dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
- max_request_wait_time
- int
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
- num_replicas
- int
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, il ridimensionamento automatico è abilitato per impostazione predefinita.
Dizionario delle proprietà del valore chiave per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie di valori chiave.
- gpu_cores
- int
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
- period_seconds
- int
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
- initial_delay_seconds
- int
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
- timeout_seconds
- int
Numero di secondi dopo il quale il probe di liveness timeout. Il valore predefinito è 2 secondi. Il valore minimo è 1.
- success_threshold
- int
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.
- failure_threshold
- int
Quando un pod inizia e il probe di liveness ha esito negativo, Kubernetes tenterà failureThreshold
i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
- namespace
- str
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). I primi e gli ultimi caratteri non possono essere trattini.
- token_auth_enabled
- bool
Indica se abilitare l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.
- cpu_cores_limit
Il numero massimo di core cpu che questo servizio Web può usare. Può essere un decimale.
- memory_gb_limit
La quantità massima di memoria (in GB) di questo servizio Web è consentita per l'uso. Può essere un decimale.
- blobfuse_enabled
- bool
Indica se abilitare blobfuse per il download di modelli per questo servizio Web. Impostazione predefinita su True
- autoscale_enabled
- bool
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se num_replicas
non è Nessuno.
- autoscale_min_replicas
- int
Numero minimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.
- autoscale_max_replicas
- int
Numero massimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Impostazione predefinita su 10
- autoscale_refresh_seconds
- int
Frequenza con cui il ridimensionatore automatico deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.
- autoscale_target_utilization
- int
L'utilizzo di destinazione (in percentuale superiore a 100) il ridimensionatore automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.
- collect_model_data
- bool
Indica se abilitare o meno la raccolta dati del modello per questo servizio Web. Il valore predefinito è False.
- auth_enabled
- bool
Indica se abilitare l'autenticazione per questo servizio Web. Impostazione predefinita su True.
- cpu_cores
- float
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0.1
- memory_gb
- float
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5
- enable_app_insights
- bool
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
- scoring_timeout_ms
- int
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
- replica_max_concurrent_requests
- int
Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
- max_request_wait_time
- int
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
- num_replicas
- int
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.
Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.
- gpu_cores
- int
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
- period_seconds
- int
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
- initial_delay_seconds
- int
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
- timeout_seconds
- int
Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.
- success_threshold
- int
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.
- failure_threshold
- int
Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà failureThreshold
i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
- namespace
- str
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.
- token_auth_enabled
- bool
Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.
- compute_target_name
- str
Nome della destinazione di calcolo in cui eseguire la distribuzione
- cpu_cores_limit
- float
È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.
- memory_gb_limit
- float
La quantità massima di memoria (in GB) che questo servizio Web può usare. Può essere un decimale.
- blobfuse_enabled
- bool
Indica se abilitare blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True
Variabili
- autoscale_enabled
- bool
Indica se abilitare la scalabilità automatica per questo servizio Web.
Il valore predefinito è True se num_replicas
non è Nessuno.
- autoscale_min_replicas
- int
Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.
- autoscale_max_replicas
- int
Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10
- autoscale_refresh_seconds
- int
Frequenza con cui l'utilità di scalabilità automatica deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.
- autoscale_target_utilization
- int
L'utilizzo di destinazione ,in percentuale su 100, il ridimensionamento automatico deve tentare di gestire per questo servizio Web. Il valore predefinito è 70.
- collect_model_data
- bool
Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.
- auth_enabled
- bool
Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.
- cpu_cores
- float
Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1
- memory_gb
- float
Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5
- enable_app_insights
- bool
Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False
- scoring_timeout_ms
- int
Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.
- replica_max_concurrent_requests
- int
Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.
- max_request_wait_time
- int
La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.
- num_replicas
- int
Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.
- primary_key
- str
Chiave di autenticazione primaria da usare per questo servizio Web.
- secondary_key
- str
Chiave di autenticazione secondaria da usare per questo servizio Web.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Dizionario di tag chiave-valore per assegnare questo servizio Web.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Descrizione da assegnare a questo servizio Web.
- gpu_cores
- int
Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.
- period_seconds
- int
La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.
- initial_delay_seconds
- int
Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.
- timeout_seconds
- int
Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.
- success_threshold
- int
Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.
- failure_threshold
- int
Quando un pod inizia e il probe di liveness ha esito negativo, Kubernetes tenterà failureThreshold
i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). I primi e gli ultimi caratteri non possono essere trattini.
- token_auth_enabled
- bool
Indica se abilitare l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.
Metodi
print_deploy_configuration |
Stampare la configurazione della distribuzione. |
validate_configuration |
Verificare che i valori di configurazione specificati siano validi. Genererà un'eccezione WebserviceException se la convalida non riesce. |
print_deploy_configuration
Stampare la configurazione della distribuzione.
print_deploy_configuration()
validate_configuration
Verificare che i valori di configurazione specificati siano validi.
Genererà un'eccezione WebserviceException se la convalida non riesce.
validate_configuration()
Eccezioni
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per