Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de changer d’annuaire.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer d’annuaire.
Un profil de charge de travail détermine le type et la quantité de ressources de calcul et de mémoire disponibles pour les applications conteneur déployées dans un environnement Azure Container Apps. Vous pouvez configurer différents profils pour répondre aux besoins différents de vos applications.
Types de profil
Azure Container Apps prend en charge trois types de profils de charge de travail : Consommation, Dédié et Flex.
Chaque type de profil détermine la façon dont vos applications sont mises à l’échelle, le niveau d’isolation des ressources et la façon dont vous êtes facturé.
Les profils de consommation utilisent une architecture serverless. Les applications sur ce profil s'adaptent automatiquement à la demande, s'agrandissant ou se réduisant, et peuvent éventuellement se réduire à zéro en cas d'inactivité. Vous payez uniquement pour les ressources que vos applications en cours d’exécution utilisent. La facturation orientée vers le serverless s’applique également aux GPU serverless pour les charges de travail spécialisées. Étant donné que vous payez uniquement pour les ressources que vos applications utilisent, le profil Consommation est bien adapté aux applications qui subissent de grandes rafales de requêtes ou de scénarios où le niveau des charges de travail est imprévisible.
Les profils dédiés s’exécutent sur des ressources de calcul réservées dans votre propre pool dédié. Vous sélectionnez la taille et le type de machine virtuelle, déployez plusieurs applications par profil et payez par instance de profil. Les profils dédiés peuvent être plus rentables pour les charges de travail stables et prendre en charge les cas d’utilisation à usage général, optimisés en mémoire et GPU.
Le profil flexible (préversion) combine la simplicité de facturation et de configuration du profil Consommation avec la plupart des caractéristiques de performances des profils dédiés. Les profils flexibles sont facturés comme un profil de consommation, avec des frais de gestion dédiés. Ils fonctionnent dans un pool de calcul monolocataire, offrent des fenêtres de maintenance planifiée, ainsi qu'un réseau dédié et un accès à des tailles de répliques plus grandes. Les profils flexibles nécessitent un sous-réseau d’au moins
/25.
Chaque environnement Container Apps inclut un profil de consommation par défaut. Vous pouvez ajouter des profils GPU dédiés ou de consommation et, lorsqu’ils sont disponibles, des profils flexibles pour répondre aux besoins de votre application.
Remarque
Le profil flexible est actuellement disponible uniquement dans les régions suivantes : EUAP USA Centre, USA Est2 EUAP, Asie Est et USA Centre Ouest.
Facteurs de forme du profil de charge de travail
Différents types de profil de charge de travail offrent différents facteurs de forme tels que l’usage général, l’optimisation de la mémoire, le GPU ou le mélange.
| Type de profil | Facteurs de forme | Descriptif | Utilisation potentielle |
|---|---|---|---|
| Consommation | Usage général | Ajouté automatiquement aux nouveaux environnements et exécuté sur une infrastructure de consommation serverless. | Applications qui ne nécessitent pas de configuration matérielle spécifique |
| Consommation | GPU (unité de traitement graphique) | Des GPU serverless à échelle nulle sont disponibles dans des régions comme l'ouest des États-Unis, l'Australie Est et Suède Centre. Pour afficher la liste complète des régions disponibles, consultez les régions prises en charge par GPU serverless | Applications qui nécessitent une accélération GPU. |
| Dédié | Usage général | Profils avec un équilibre entre ressources processeur et mémoire. | Applications nécessitant de grandes quantités de processeur ou de mémoire. |
| Dédié | Mémoire optimisée | Profils avec des ressources de mémoire accrues pour les données en mémoire ou les modèles Machine Learning. | Applications avec des exigences élevées en mémoire. |
| Dédié | GPU (unité de traitement graphique) | Les profils avec calcul avec GPU sont disponibles uniquement dans certaines régions. Les profils dédiés avec GPU doivent être configurés lors de la création d’un environnement. | Applications qui nécessitent l’accélération GPU et le matériel dédié. |
Remarque
Lorsque vous utilisez des profils avec GPU, vérifiez que votre application exécute la dernière version de CUDA.
Détails du profil
Les tableaux suivants résument les profils de charge de travail disponibles par type de profil, en regroupant des tailles similaires pour vous aider à déterminer l’option qui vous convient le mieux. Les champs de processeur virtuel et de mémoire affichent la plage de ressources entre les tailles de profil.
Détails du profil de consommation
| Noms de profil | Plage de vCPU | Plage de mémoire | Type de l'GPU | Régions | Répartition |
|---|---|---|---|---|---|
| Consommation | 0.25-4 | 0,5-8 Gio | Toutes les régions prises en charge | par réplica | |
| Consumption-GPU-NC24-A100, Consumption-GPU-NC8as-T4 | 8–24 | 56 à 220 Gio | NVIDIA T4, A100 | Pour afficher la liste complète des régions disponibles, consultez les régions prises en charge par GPU serverless | par réplica |
Tous les profils de consommation prennent en charge la mise à l'échelle serverless et sont facturés en fonction de l'utilisation par réplica.
Détails du profil dédié
| Classification | Noms de profil | Plage de vCPU | Plage de mémoire | Type de l'GPU | Régions | Répartition |
|---|---|---|---|---|---|---|
| General Purpose | D4, D8, D16, D32 | 4–32 | 16 à 128 Gio | Aucun | Toutes les régions prises en charge | par nœud |
| Mémoire optimisée | E4, E8, E16, E32 | 4–32 | 32–256 Gio | Aucun | Toutes les régions prises en charge | par nœud |
| Calcul confidentiel | DC4, DC8, DC16, DC32, DC48, DC64, DC96 | 4-96 | 16-384 Gio | Aucun | UAENorth | par nœud |
| GPU (unité de traitement graphique) | NC24-A100, NC48-A100, NC96-A100 | 24–96 | 220 à 880 Gio | A100 | USA Ouest 3, Europe Nord | par nœud |
Remarque
Les profils dédiés avec GPU allouent la capacité par cas. Vous devez envoyer un ticket de support pour demander la capacité requise.
Détails du profil adaptable (aperçu)
| Noms de profil | Plage de vCPU | Plage de mémoire | Régions | Répartition |
|---|---|---|---|---|
| Flexible | 0.25-4 | 0,5-16 Gio | USA Centre (EUAP), USA Est2 (EUAP), Asie Est, USA Centre Ouest | par réplica |
Consommation et mise à l’échelle des ressources
Vous pouvez limiter l’utilisation de la mémoire et du processeur pour chaque application dans un profil de charge de travail. Comme plusieurs applications peuvent partager une seule instance de profil, vous devrez peut-être ajuster les paramètres de mémoire du profil pour garantir des ressources adéquates pour toutes les applications.
N’oubliez pas que les ressources totales disponibles pour vos applications sont légèrement inférieures à l’allocation du profil, car le runtime réserve certaines ressources de calcul. Lorsque la demande augmente au-delà des ressources actuelles, le système ajoute automatiquement davantage d’instances de profil. À mesure que la demande diminue, le système supprime les instances. Vous pouvez contrôler la mise à l’échelle en définissant le nombre minimal et maximal d’instances. La facturation est basée sur le nombre d’instances de profil actives.
Réseau
Les environnements de profil de charge de travail exposent des fonctionnalités réseau supplémentaires, telles que des itinéraires définis par l’utilisateur, pour sécuriser le trafic d’entrée et de sortie. Pour plus d’informations, consultez la documentation réseau .