Partage via


Quotas, restrictions de taille de machine virtuelle et disponibilité des régions dans Azure Kubernetes Service (AKS)

Tous les services Azure définissent des limites et des quotas par défaut pour les ressources et les fonctionnalités, notamment des restrictions d’utilisation pour certaines références SKU de machines virtuelles.

Cet article détaille les limites par défaut des ressources Azure Kubernetes Service (AKS) et la disponibilité d’AKS dans les régions Azure.

Quotas et limites du service

Ressource Limite
Nombre maximal de clusters par abonnement globalement 5 000
Nombre maximal de clusters par abonnement par région pour les abonnements Contrat Entreprise 1 1 000
Nombre maximal de clusters par abonnement par région pour les abonnements CSP, paiement à l’utilisation, Parrainé, MSDN, MPN, Azure Pass, Azure In Open et Azure Pass 1 100
Nombre maximal de clusters par abonnement par région pour la version d’évaluation gratuite et Les abonnements Azure pour étudiants 1 3
Nombre maximal de nœuds par cluster avec Virtual Machine Scale Sets et SKU Standard Load Balancer 5 000 dans tous les groupes de nœuds
Remarque : Si vous ne parvenez pas à effectuer un scale-up jusqu’à 5 000 nœuds par cluster, consultez Meilleures pratiques pour les grands clusters.
Nombre maximal de nœuds par pool de nœuds (pools de nœuds de groupes de machines virtuelles identiques) 1 000
Nombre maximal de pools de nœuds par cluster 100
Nombre maximal de pods par nœud : avec le plug-in de réseau Kubenet1 Maximum : 250
Valeur Azure CLI par défaut : 110
Valeur par défaut du modèle Azure Resource Manager : 110
Valeur par défaut du déploiement sur le portail Azure : 30
Nombre maximal de pods par nœud : avec Azure Container Networking Interface (Azure CNI)2 Maximum : 250
Maximum recommandé pour les conteneurs Windows Server : 110
Valeur par défaut : 30
Module complémentaire AKS OSM (Open Service Mesh) Version du cluster Kubernetes : versions prises en charge par AKS
Contrôleurs OSM par cluster : 1
Nombre de pods par contrôleur OSM : 1 600
Comptes de service Kubernetes gérés par OSM : 160
Nombre maximal de services Kubernetes à charge équilibrée par cluster avec la référence SKU Standard Load Balancer 300
Nombre maximal de nœuds par cluster avec les groupes à haute disponibilité de machines virtuelles et la référence SKU Standard Load Balancer 100

1 Pour demander une augmentation de la limite de quota, créez une demande de support. L’essai gratuit et les abonnements Azure for Students ne sont pas éligibles pour les augmentations de limite ou de quota. Si vous disposez d’un essai gratuit ou d’un abonnement Azure for Students, vous pouvez effectuer une mise à niveau vers un abonnement avec paiement à l’utilisation.
2 Les conteneurs Windows Server doivent utiliser le plug-in de mise en réseau Azure CNI. Kubenet n’est pas pris en charge pour les conteneurs Windows Server.

Niveau de service du plan de contrôle Kubernetes Limite
Niveau standard Met automatiquement à l’échelle le serveur d’API Kubernetes en fonction de la charge. Limites plus grandes des composants du plan de contrôle et des instances de serveur API et etcd.
Niveau Gratuit Ressources limitées avec une limite des requêtes en vol fixée à 50 appels en mutation et 100 appels en lecture seule. Limite recommandée de 10 nœuds par cluster. Idéal pour l’expérimentation, l’apprentissage et les tests simples. Non recommandé pour des charges de travail de production/critiques.

Limites de limitation des API du fournisseur de ressources AKS

AKS utilise l’algorithme de limitation de compartiment de jetons pour limiter certaines API de fournisseur de ressources AKS. Cela garantit les performances du service et favorise l’utilisation équitable du service pour tous les clients.

Les compartiments ont une taille fixe (également appelée taux de rafale) et le remplissage au fil du temps à un taux fixe (également appelé taux soutenu). Chaque limite de régulation est appliquée au niveau régional pour la ressource spécifiée dans cette région. Par exemple, dans le tableau ci-dessous, un abonnement peut appeler ListManagedClusters un maximum de 60 fois (taux de rafale) simultanément pour chaque groupe de ressources, mais peut continuer à effectuer 1 appel par seconde par la suite (taux soutenu).

Requête d’API Taille du seau Taux de remplissage Étendue
LIST ManagedClusters 500 requêtes 1 requête/1 seconde Abonnement
LIST ManagedClusters 60 requêtes 1 demande / 1 seconde ResourceGroup
PUT AgentPool 20 requêtes 1 requête/1 minute AgentPool
PUT ManagedCluster 20 requêtes 1 requête/1 minute Cluster géré
GET ManagedCluster 60 requêtes 1 demande / 1 seconde Cluster managé
État de l’opération GET 200 requêtes 2 requêtes / 1 seconde Abonnement
Toutes les autres API 60 requêtes 1 demande / 1 seconde Abonnement

Remarque

Les compartiments ManagedClusters et AgentPools sont comptabilisés séparément pour le même cluster AKS.

Si une requête est limitée, la requête retourne le code de réponse HTTP 429 (Trop de requêtes) et le code d’erreur s’affiche comme Throttled dans la réponse. Chaque requête limitée inclut un Retry-After dans l’en-tête de réponse HTTP qui indique le temps d'attente avant de réessayer, en secondes. Les clients qui utilisent un modèle d’appel d’API bursty doivent s’assurer que la nouvelle tentative après peut être gérée de manière appropriée. Pour en savoir plus sur retry-After, consultez l’article suivant. Plus précisément, AKS utilise delay-seconds pour spécifier la nouvelle tentative.

Infrastructure approvisionnée

Toutes les autres limitations réseau, de calcul et de stockage s’appliquent à l’infrastructure approvisionnée. Pour connaître les limites appropriées, consultez Limites du service et de l’abonnement Azure.

Important

Lorsque vous mettez à niveau un cluster AKS, des ressources supplémentaires sont consommées momentanément. Ces ressources incluent les adresses IP disponibles d’un sous-réseau de réseau virtuel ou le quota de processeurs virtuels de machine virtuelle.

Pour les conteneurs Windows Server, vous pouvez effectuer une opération de mise à niveau pour appliquer les dernières mises à jour des nœuds. Si vous ne disposez pas de l’espace d’adressage IP ou du quota de processeurs virtuels disponibles pour gérer ces ressources temporaires, le processus de mise à niveau du cluster échoue. Pour plus d’informations sur la mise à niveau d’un nœud Windows Server, voir Mettre à niveau un pool de nœuds dans AKS.

Tailles des machines virtuelles prises en charge

La liste des tailles de machines virtuelles prises en charge dans AKS évolue avec la publication de nouveaux niveaux tarifaires de machine virtuelle dans Azure. Veuillez suivre les notes de publication d'AKS pour vous tenir informé des nouvelles références produits prises en charge.

Tailles de machines virtuelles limitées

Chaque nœud d’un cluster AKS contient une quantité fixe de ressources de calcul telles que des processeurs virtuels et de la mémoire. En raison des ressources de calcul requises pour exécuter Correctement Kubernetes, certaines tailles de référence SKU de machine virtuelle sont limitées par défaut dans AKS. Ces restrictions permettent de s’assurer que les pods peuvent être planifiés et fonctionner correctement sur ces nœuds.

Pools de nœuds utilisateur

Pour les pools de nœuds utilisateur, les tailles de machine virtuelle avec moins de deux processeurs virtuels et deux Go de RAM (mémoire) peuvent ne pas être utilisées.

Pools de nœuds système

Pour les pools de nœuds système, les tailles de machine virtuelle avec moins de deux processeurs virtuels et quatre Go de RAM (mémoire) peuvent ne pas être utilisées. Pour vous assurer que les pods kube-system requis et vos applications peuvent être planifiés de manière fiable, il est recommandé de ne pas utiliser de machines virtuelles de série B ni de machines virtuelles de série Av1.

Pour plus d’informations sur les types de machines virtuelles et leurs ressources de calcul, consultez Tailles des machines virtuelles dans Azure.

Tailles d’image conteneur prises en charge

AKS ne définit pas de limite concernant la taille des images conteneur. Toutefois, il est important de comprendre que plus l’image conteneur est grande, plus la demande en mémoire est élevée. Cela peut potentiellement dépasser les limites de ressources ou la mémoire globale disponible des nœuds de travail. Par défaut, la mémoire pour la taille de la machine virtuelle Standard_DS2_v2 pour un cluster AKS est définie sur 7 Gio.

Lorsqu’une image conteneur est très grande (1 Tio ou plus), kubelet risque de ne pas pouvoir l’extraire de votre registre de conteneurs pour la mettre dans un nœud en raison d’un manque d’espace disque.

Disponibilité des régions

Pour obtenir la liste la plus récente des emplacements où vous pouvez déployer et exécuter des clusters, consultez Disponibilité des régions AKS.

Valeurs par défaut des VM intelligentes

À compter de mai 2025, AKS sélectionne automatiquement la référence SKU de machine virtuelle par défaut optimale en fonction de la capacité et du quota disponibles si le paramètre n’est pas spécifié pendant le déploiement. Cela garantit que les déploiements sont mis en correspondance avec la meilleure référence SKU possible, améliorant les performances et la fiabilité tout en optimisant l’utilisation des ressources. Auparavant, la référence SKU de machine virtuelle AKS par défaut était Standard_DS2_V2, mais il existe désormais des résultats dynamiques dans l’approvisionnement par défaut en fonction de la disponibilité de la référence SKU. Cela affecte toutes les nouvelles opérations de création de machine virtuelle.

Préréglages de configuration de cluster dans le portail Azure

Lorsque vous créez un cluster à l’aide du portail Azure, vous pouvez choisir une configuration prédéfinie pour personnaliser rapidement en fonction de votre scénario. Vous pouvez modifier les valeurs prédéfinies à tout moment.

Préréglage Descriptif
Norme de production Idéal pour la plupart des applications qui servent le trafic de production, avec les meilleures pratiques recommandées par AKS.
Développement/Test Idéal pour développer de nouvelles charges de travail ou de tester celles existantes.
Économie de production Idéal pour servir le trafic de production de façon soucieuse des coûts, si vos charges de travail peuvent tolérer des interruptions.
Entreprise de production Idéal pour servir le trafic de production, avec des autorisations rigoureuses et une sécurité renforcée.
Norme de production Développement/Test Économie de production Entreprise de production
Taille du nœud du pool de nœuds système Standard_D8ds_v5 Standard_D4ds_v5 Standard_D8ds_v5 Standard_D16ds_v5
Plage de mise à l’échelle automatique du pool de nœuds système 2 à 5 nœuds 2 à 5 nœuds 2 à 5 nœuds 2 à 5 nœuds
Taille du nœud du pool de nœuds utilisateur Standard_D8ds_v5 - Standard_D8as_v4 Standard_D8ds_v5
Plage de mise à l’échelle automatique du pool de nœuds utilisateur 2 à 100 nœuds - 0 à 25 nœuds 2 à 100 nœuds
Cluster privé - - -
Zones de disponibilité - -
Azure Policy - -
Azure Monitor. - -
Pilote Secrets Store CSI - -
Configuration réseau Superposition Azure CNI Superposition Azure CNI Superposition Azure CNI Superposition Azure CNI
Stratégie réseau Aucun Aucun Aucun Aucun
Authentification et autorisation Comptes locaux avec RBAC Kubernetes Comptes locaux avec RBAC Kubernetes Authentification d’ID Microsoft Entra avec Azure RBAC Authentification d’ID Microsoft Entra avec Azure RBAC

Étapes suivantes

Vous pouvez augmenter des limites par défaut et des quotas. Si votre ressource prend en charge les augmentations, demandez-en une via une demande de support Azure (pour Type de problème, sélectionnez Quota).