AksServiceDeploymentConfiguration Classe
Représente les informations de configuration de déploiement pour un service déployé sur Azure Kubernetes Service.
Crée un objet AksServiceDeploymentConfiguration à l’aide de la méthode deploy_configuration
de la classe AksWebservice.
Initialisez un objet de configuration pour le déploiement sur une cible de calcul AKS.
- Héritage
-
AksServiceDeploymentConfiguration
Constructeur
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Paramètres
- cpu_cores_limit
Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- memory_gb_limit
Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- autoscale_enabled
- bool
Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web.
La valeur par défaut est True si num_replicas
a la valeur None.
- autoscale_min_replicas
- int
Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.
- autoscale_max_replicas
- int
Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10
- autoscale_refresh_seconds
- int
Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.
- autoscale_target_utilization
- int
Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.
- collect_model_data
- bool
Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.
- auth_enabled
- bool
Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.
- cpu_cores
- float
Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1
- memory_gb
- float
Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5
- enable_app_insights
- bool
Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False
- scoring_timeout_ms
- int
Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.
- replica_max_concurrent_requests
- int
Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.
- max_request_wait_time
- int
Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.
- num_replicas
- int
Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.
Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.
- gpu_cores
- int
Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.
- period_seconds
- int
Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.
- initial_delay_seconds
- int
Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.
- timeout_seconds
- int
Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.
- success_threshold
- int
Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.
- failure_threshold
- int
Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold
fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.
- namespace
- str
Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.
- token_auth_enabled
- bool
Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.
- cpu_cores_limit
Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- memory_gb_limit
Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- blobfuse_enabled
- bool
Indique s’il faut ou non activer blobfuse pour le téléchargement de modèle pour ce Webservice. La valeur par défaut est True
- autoscale_enabled
- bool
Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web.
La valeur par défaut est True si num_replicas
a la valeur None.
- autoscale_min_replicas
- int
Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.
- autoscale_max_replicas
- int
Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10
- autoscale_refresh_seconds
- int
Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.
- autoscale_target_utilization
- int
Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.
- collect_model_data
- bool
Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.
- auth_enabled
- bool
Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.
- cpu_cores
- float
Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1
- memory_gb
- float
Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5
- enable_app_insights
- bool
Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False
- scoring_timeout_ms
- int
Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.
- replica_max_concurrent_requests
- int
Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.
- max_request_wait_time
- int
Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.
- num_replicas
- int
Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.
Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.
- gpu_cores
- int
Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.
- period_seconds
- int
Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.
- initial_delay_seconds
- int
Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.
- timeout_seconds
- int
Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.
- success_threshold
- int
Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.
- failure_threshold
- int
Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold
fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.
- namespace
- str
Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.
- token_auth_enabled
- bool
Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.
- cpu_cores_limit
- float
Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- memory_gb_limit
- float
Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.
- blobfuse_enabled
- bool
Indique s’il faut ou non activer blobfuse pour le téléchargement de modèle pour ce Webservice. La valeur par défaut est True
Variables
- autoscale_enabled
- bool
Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web.
La valeur par défaut est True si num_replicas
a la valeur None.
- autoscale_min_replicas
- int
Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.
- autoscale_max_replicas
- int
Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10
- autoscale_refresh_seconds
- int
Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.
- autoscale_target_utilization
- int
Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.
- collect_model_data
- bool
Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.
- auth_enabled
- bool
Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.
- cpu_cores
- float
Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1
- memory_gb
- float
Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5
- enable_app_insights
- bool
Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False
- scoring_timeout_ms
- int
Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.
- replica_max_concurrent_requests
- int
Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.
- max_request_wait_time
- int
Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.
- num_replicas
- int
Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.
- primary_key
- str
Clé d’authentification primaire à utiliser pour ce Webservice.
- secondary_key
- str
Clé d’authentification secondaire à utiliser pour ce Webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Dictionnaire d’étiquettes (clé-valeur) à fournir à ce Webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Description à fournir à ce Webservice.
- gpu_cores
- int
Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.
- period_seconds
- int
Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.
- initial_delay_seconds
- int
Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.
- timeout_seconds
- int
Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.
- success_threshold
- int
Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.
- failure_threshold
- int
Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold
fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.
- token_auth_enabled
- bool
Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.
Méthodes
print_deploy_configuration |
Imprimez la configuration du déploiement. |
validate_configuration |
Vérifiez que les valeurs de configuration spécifiées sont valides. Lève une WebserviceException si la validation échoue. |
print_deploy_configuration
Imprimez la configuration du déploiement.
print_deploy_configuration()
validate_configuration
Vérifiez que les valeurs de configuration spécifiées sont valides.
Lève une WebserviceException si la validation échoue.
validate_configuration()
Exceptions
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour