Partager via


Profils de charge de travail dans Azure Container Apps

Un profil de charge de travail détermine le type et la quantité de ressources de calcul et de mémoire disponibles pour les applications conteneur déployées dans un environnement Azure Container Apps. Vous pouvez configurer différents profils pour répondre aux besoins différents de vos applications.

Types de profil

Azure Container Apps prend en charge trois types de profils de charge de travail : Consommation, Dédié et Flex.

Chaque type de profil détermine la façon dont vos applications sont mises à l’échelle, le niveau d’isolation des ressources et la façon dont vous êtes facturé.

  • Les profils de consommation utilisent une architecture serverless. Les applications sur ce profil s'adaptent automatiquement à la demande, s'agrandissant ou se réduisant, et peuvent éventuellement se réduire à zéro en cas d'inactivité. Vous payez uniquement pour les ressources que vos applications en cours d’exécution utilisent. La facturation orientée vers le serverless s’applique également aux GPU serverless pour les charges de travail spécialisées. Étant donné que vous payez uniquement pour les ressources que vos applications utilisent, le profil Consommation est bien adapté aux applications qui subissent de grandes rafales de requêtes ou de scénarios où le niveau des charges de travail est imprévisible.

  • Les profils dédiés s’exécutent sur des ressources de calcul réservées dans votre propre pool dédié. Vous sélectionnez la taille et le type de machine virtuelle, déployez plusieurs applications par profil et payez par instance de profil. Les profils dédiés peuvent être plus rentables pour les charges de travail stables et prendre en charge les cas d’utilisation à usage général, optimisés en mémoire et GPU.

  • Le profil flexible (préversion) combine la simplicité de facturation et de configuration du profil Consommation avec la plupart des caractéristiques de performances des profils dédiés. Les profils flexibles sont facturés comme un profil de consommation, avec des frais de gestion dédiés. Ils fonctionnent dans un pool de calcul monolocataire, offrent des fenêtres de maintenance planifiée, ainsi qu'un réseau dédié et un accès à des tailles de répliques plus grandes. Les profils flexibles nécessitent un sous-réseau d’au moins /25.

Chaque environnement Container Apps inclut un profil de consommation par défaut. Vous pouvez ajouter des profils GPU dédiés ou de consommation et, lorsqu’ils sont disponibles, des profils flexibles pour répondre aux besoins de votre application.

Remarque

Le profil flexible est actuellement disponible uniquement dans les régions suivantes : EUAP USA Centre, USA Est2 EUAP, Asie Est et USA Centre Ouest.

Facteurs de forme du profil de charge de travail

Différents types de profil de charge de travail offrent différents facteurs de forme tels que l’usage général, l’optimisation de la mémoire, le GPU ou le mélange.

Type de profil Facteurs de forme Descriptif Utilisation potentielle
Consommation Usage général Ajouté automatiquement aux nouveaux environnements et exécuté sur une infrastructure de consommation serverless. Applications qui ne nécessitent pas de configuration matérielle spécifique
Consommation GPU (unité de traitement graphique) Des GPU serverless à échelle nulle sont disponibles dans des régions comme l'ouest des États-Unis, l'Australie Est et Suède Centre. Pour afficher la liste complète des régions disponibles, consultez les régions prises en charge par GPU serverless Applications qui nécessitent une accélération GPU.
Dédié Usage général Profils avec un équilibre entre ressources processeur et mémoire. Applications nécessitant de grandes quantités de processeur ou de mémoire.
Dédié Mémoire optimisée Profils avec des ressources de mémoire accrues pour les données en mémoire ou les modèles Machine Learning. Applications avec des exigences élevées en mémoire.
Dédié GPU (unité de traitement graphique) Les profils avec calcul avec GPU sont disponibles uniquement dans certaines régions. Les profils dédiés avec GPU doivent être configurés lors de la création d’un environnement. Applications qui nécessitent l’accélération GPU et le matériel dédié.

Remarque

Lorsque vous utilisez des profils avec GPU, vérifiez que votre application exécute la dernière version de CUDA.

Détails du profil

Les tableaux suivants résument les profils de charge de travail disponibles par type de profil, en regroupant des tailles similaires pour vous aider à déterminer l’option qui vous convient le mieux. Les champs de processeur virtuel et de mémoire affichent la plage de ressources entre les tailles de profil.

Détails du profil de consommation

Noms de profil Plage de vCPU Plage de mémoire Type de l'GPU Régions Répartition
Consommation 0.25-4 0,5-8 Gio Toutes les régions prises en charge par réplica
Consumption-GPU-NC24-A100, Consumption-GPU-NC8as-T4 8–24 56 à 220 Gio NVIDIA T4, A100 Pour afficher la liste complète des régions disponibles, consultez les régions prises en charge par GPU serverless par réplica

Tous les profils de consommation prennent en charge la mise à l'échelle serverless et sont facturés en fonction de l'utilisation par réplica.

Détails du profil dédié

Classification Noms de profil Plage de vCPU Plage de mémoire Type de l'GPU Régions Répartition
General Purpose D4, D8, D16, D32 4–32 16 à 128 Gio Aucun Toutes les régions prises en charge par nœud
Mémoire optimisée E4, E8, E16, E32 4–32 32–256 Gio Aucun Toutes les régions prises en charge par nœud
Calcul confidentiel DC4, DC8, DC16, DC32, DC48, DC64, DC96 4-96 16-384 Gio Aucun UAENorth par nœud
GPU (unité de traitement graphique) NC24-A100, NC48-A100, NC96-A100 24–96 220 à 880 Gio A100 USA Ouest 3, Europe Nord par nœud

Remarque

Les profils dédiés avec GPU allouent la capacité par cas. Vous devez envoyer un ticket de support pour demander la capacité requise.

Détails du profil adaptable (aperçu)

Noms de profil Plage de vCPU Plage de mémoire Régions Répartition
Flexible 0.25-4 0,5-16 Gio USA Centre (EUAP), USA Est2 (EUAP), Asie Est, USA Centre Ouest par réplica

Consommation et mise à l’échelle des ressources

Vous pouvez limiter l’utilisation de la mémoire et du processeur pour chaque application dans un profil de charge de travail. Comme plusieurs applications peuvent partager une seule instance de profil, vous devrez peut-être ajuster les paramètres de mémoire du profil pour garantir des ressources adéquates pour toutes les applications.

N’oubliez pas que les ressources totales disponibles pour vos applications sont légèrement inférieures à l’allocation du profil, car le runtime réserve certaines ressources de calcul. Lorsque la demande augmente au-delà des ressources actuelles, le système ajoute automatiquement davantage d’instances de profil. À mesure que la demande diminue, le système supprime les instances. Vous pouvez contrôler la mise à l’échelle en définissant le nombre minimal et maximal d’instances. La facturation est basée sur le nombre d’instances de profil actives.

Réseau

Les environnements de profil de charge de travail exposent des fonctionnalités réseau supplémentaires, telles que des itinéraires définis par l’utilisateur, pour sécuriser le trafic d’entrée et de sortie. Pour plus d’informations, consultez la documentation réseau .

Étapes suivantes