azureml.core.webservice.aks.AksServiceDeploymentConfiguration class - Azure Machine Learning Python

cpu_cores_limit

Obligatoire

Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

memory_gb_limit

Obligatoire

Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

autoscale_enabled: bool

Obligatoire

Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web. La valeur par défaut est True si num_replicas a la valeur None.

autoscale_min_replicas: int

Obligatoire

Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.

autoscale_max_replicas: int

Obligatoire

Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10

autoscale_refresh_seconds: int

Obligatoire

Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.

autoscale_target_utilization: int

Obligatoire

Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.

collect_model_data: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.

auth_enabled: bool

Obligatoire

Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.

cpu_cores: float

Obligatoire

Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1

memory_gb: float

Obligatoire

Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5

enable_app_insights: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False

scoring_timeout_ms: int

Obligatoire

Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.

replica_max_concurrent_requests: int

Obligatoire

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

max_request_wait_time: int

Obligatoire

Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

num_replicas: int

Obligatoire

Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.

primary_key: str

Obligatoire

Clé d’authentification primaire à utiliser pour ce Webservice.

secondary_key: str

Obligatoire

Clé d’authentification secondaire à utiliser pour ce Webservice.

tags: dict[str, str]

Obligatoire

Dictionnaire d’étiquettes (clé-valeur) à fournir à ce Webservice.

properties: dict[str, str]

Obligatoire

Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.

description: str

Obligatoire

Description à fournir à ce Webservice.

gpu_cores: int

Obligatoire

Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.

period_seconds: int

Obligatoire

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.

initial_delay_seconds: int

Obligatoire

Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.

timeout_seconds: int

Obligatoire

Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

success_threshold: int

Obligatoire

Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

failure_threshold: int

Obligatoire

Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.

namespace: str

Obligatoire

Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.

token_auth_enabled: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

cpu_cores_limit

Obligatoire

Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

memory_gb_limit

Obligatoire

Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

blobfuse_enabled: bool

valeur par défaut: None

Indique s’il faut ou non activer blobfuse pour le téléchargement de modèle pour ce Webservice. La valeur par défaut est True

autoscale_enabled: bool

Obligatoire

Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web. La valeur par défaut est True si num_replicas a la valeur None.

autoscale_min_replicas: int

Obligatoire

Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.

autoscale_max_replicas: int

Obligatoire

Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10

autoscale_refresh_seconds: int

Obligatoire

Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.

autoscale_target_utilization: int

Obligatoire

Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.

collect_model_data: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.

auth_enabled: bool

Obligatoire

Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.

cpu_cores: float

Obligatoire

Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1

memory_gb: float

Obligatoire

Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5

enable_app_insights: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False

scoring_timeout_ms: int

Obligatoire

Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.

replica_max_concurrent_requests: int

Obligatoire

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

max_request_wait_time: int

Obligatoire

Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

num_replicas: int

Obligatoire

Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.

primary_key: str

Obligatoire

Clé d’authentification primaire à utiliser pour ce Webservice.

secondary_key: str

Obligatoire

Clé d’authentification secondaire à utiliser pour ce Webservice.

tags: dict[str, str]

Obligatoire

Dictionnaire d’étiquettes (clé-valeur) à fournir à ce Webservice.

properties: dict[str, str]

Obligatoire

Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.

description: str

Obligatoire

Description à fournir à ce Webservice.

gpu_cores: int

Obligatoire

Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.

period_seconds: int

Obligatoire

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.

initial_delay_seconds: int

Obligatoire

Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.

timeout_seconds: int

Obligatoire

Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

success_threshold: int

Obligatoire

Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

failure_threshold: int

Obligatoire

Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.

namespace: str

Obligatoire

Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.

token_auth_enabled: bool

Obligatoire

Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

compute_target_name: str

Obligatoire

Nom de la cible de calcul sur laquelle effectuer le déploiement

cpu_cores_limit: float

Obligatoire

Nombre maximal de cœurs de processeur que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

memory_gb_limit: float

Obligatoire

Quantité maximale de mémoire (en Go) que ce Webservice est autorisé à utiliser. Peut être un nombre décimal.

blobfuse_enabled: bool

Obligatoire

Indique s’il faut ou non activer blobfuse pour le téléchargement de modèle pour ce Webservice. La valeur par défaut est True

autoscale_enabled: bool

Indique s’il est nécessaire d’activer la mise à l’échelle automatique pour ce service web. La valeur par défaut est True si num_replicas a la valeur None.

autoscale_min_replicas: int

Nombre minimal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est de 1.

autoscale_max_replicas: int

Nombre maximal de conteneurs à utiliser durant la mise à l’échelle automatique de ce Webservice. La valeur par défaut est 10

autoscale_refresh_seconds: int

Fréquence à laquelle l’autoscaler doit tenter de mettre à l’échelle ce Webservice. La valeur par défaut est de 1.

autoscale_target_utilization: int

Utilisation cible en pourcentage que l’autoscaler doit tenter de conserver pour ce Webservice. La valeur par défaut est 70.

collect_model_data: bool

Indique s’il est nécessaire ou non d’activer la collecte de données de modèle pour ce Webservice. Valeur par défaut False.

auth_enabled: bool

Indique s’il faut activer ou pas l’authentification pour ce service web. La valeur par défaut est True.

cpu_cores: float

Nombre de cœurs de processeur à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.1

memory_gb: float

Quantité de mémoire (en Go) à allouer pour ce Webservice. Peut être un nombre décimal. La valeur par défaut est 0.5

enable_app_insights: bool

Indique s’il est nécessaire ou non d’activer la journalisation Application Insights pour ce Webservice. Par défaut, False

scoring_timeout_ms: int

Délai d’expiration à appliquer pour le scoring des appels à ce Webservice. La valeur par défaut est 60000.

replica_max_concurrent_requests: int

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce Webservice. La valeur par défaut est de 1. Ne modifiez pas la valeur de ce paramètre (la valeur par défaut est 1), sauf indication contraire du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

max_request_wait_time: int

Durée maximale pendant laquelle une requête reste en file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

num_replicas: int

Nombre de conteneurs à allouer pour ce Webservice. Aucune valeur par défaut. Si ce paramètre n’est pas défini, l’autoscaler est activé par défaut.

primary_key: str

Clé d’authentification primaire à utiliser pour ce Webservice.

secondary_key: str

Clé d’authentification secondaire à utiliser pour ce Webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dictionnaire d’étiquettes (clé-valeur) à fournir à ce Webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dictionnaire de propriétés (clé-valeur) à fournir à ce Webservice. Vous ne pouvez pas changer ces propriétés après le déploiement. Toutefois, vous pouvez ajouter de nouvelles paires clé-valeur.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Description à fournir à ce Webservice.

gpu_cores: int

Nombre de cœurs GPU à allouer pour ce service web. La valeur par défaut est 0.

period_seconds: int

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est 10 secondes. La valeur minimale est 1.

initial_delay_seconds: int

Nombre de secondes après le démarrage du conteneur avant le lancement des probes liveness. La valeur par défaut est 310.

timeout_seconds: int

Délai d’expiration en secondes de la probe liveness. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

success_threshold: int

Nombre minimal de réussites consécutives pour que la probe liveness soit considérée comme réussie après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

failure_threshold: int

Lorsqu’un Pod démarre et que la probe liveness échoue, Kubernetes essaie failureThreshold fois avant d’abandonner. La valeur par défaut est 3. La valeur minimale est 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Espace de noms Kubernetes sur lequel déployer ce Webservice : jusqu’à 63 caractères alphanumériques minuscules (lettres allant de « a » à « z », chiffres allant de « 0 » à « 9 » et traits d’union (« - »)). Le premier caractère et le dernier caractère ne peuvent pas être des traits d’union.

token_auth_enabled: bool

Indique s’il est nécessaire ou non d’activer l’authentification Azure Active Directory pour ce service web. Si cette option est activée, les utilisateurs peuvent accéder au Webservice en récupérant un jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

AksServiceDeploymentConfiguration Classe

Constructeur

Paramètres

Variables

Méthodes

print_deploy_configuration

validate_configuration

Exceptions

Commentaires

Commentaires

Ressources supplémentaires