Capacité d’une instance du service Gestion des API Azure

S’APPLIQUE À : Développeur | De base | Standard | Premium

La capacité est la métrique Azure Monitor la plus importante et celle dont vous devez tenir compte pour prendre des décisions éclairées en ce qui concerne la mise à l’échelle ou la mise à niveau d’une instance du service Gestion des API pour accepter une charge plus élevée. Sa construction est complexe et requiert l’adoption d’un certain comportement.

Cet article explique ce à quoi correspond la capacité, ainsi que son comportement. Il décrit comment accéder aux métriques de capacité dans le Portail Azure et vous informe quand le moment est venu de procéder à une mise à l’échelle ou à une mise à niveau de votre instance du service Gestion des API.

Important

Cet article explique comment surveiller et mettre à l’échelle votre instance de Gestion des API Azure en fonction de sa métrique de capacité. Toutefois, il est tout aussi important de comprendre ce qui se passe quand une instance de Gestion des API Azure a réellement atteint sa capacité. La Gestion des API Azure n’applique pas de limitation au niveau du service pour empêcher une surcharge physique des instances. Quand une instance atteint sa capacité physique, elle se comporte comme tout serveur web surchargé incapable de traiter des demandes entrantes : la latence augmente, des connexions sont abandonnées, des erreurs de délai d’attente se produisent, etc. Cela signifie que les clients d’API doivent être prêts à gérer cette éventualité comme avec tout autre service externe (par exemple, en appliquant des stratégies de nouvelle tentative).

Prérequis

Pour suivre les étapes décrites dans cet article, vous devez avoir :

Disponibilité

Important

L’agrégation Max de la métrique de capacité est uniquement prise en charge dans le niveau Premium de Gestion des API.

Définition de la capacité

Diagramme expliquant la métrique Capacité.

La capacité est un indicateur de charge sur une instance de gestion des API. Elle reflète l’utilisation des ressources (UC, mémoire) et les longueurs de files d’attente réseau. L’utilisation de la mémoire et de l’UC indique la consommation des ressources par :

  • Les services de plan de données de Gestion des API, tels que le traitement des demandes, qui incluent le transfert de demandes ou l’exécution d’une stratégie.
  • Les services de plan de gestion de Gestion des API, tels que les actions de gestion appliquées via le portail Azure ou Azure Resource Manager, ou une charge provenant du portail des développeurs.
  • Les processus de système d’exploitation sélectionnés, y compris les processus qui impliquent le coût des négociations TLS sur les nouvelles connexions.
  • Mises à jour de plateforme, telles que les mises à jour du système d’exploitation sur les ressources de calcul sous-jacentes pour l’instance.
  • Nombre d’API déployées, indépendamment de l’activité, qui peuvent consommer de la capacité supplémentaire.

La capacité totale est une moyenne de ses propres valeurs issues de chacune des unités d’une instance du service Gestion des API.

Bien que la métrique de capacité soit conçue pour mettre en évidence les problèmes liés à votre instance de gestion des API, il existe des cas où les problèmes ne seront pas reflétés dans les modifications de la métrique de capacité.

Comportement de la métrique de capacité

En raison de sa structure, la capacité peut être influencée par de nombreuses variables dans la vie réelle. Par exemple :

  • des modèles de connexion (nouvelle connexion basée sur une requête ou réutilisation de la connexion existante)
  • la taille d’une requête et d’une réponse
  • des stratégies configurées sur chaque API ou le nombre de clients envoyant des requêtes.

Plus les opérations sur les requêtes sont complexes, plus la consommation de la capacité sera élevée. Par exemple, les stratégies de transformation complexes utilisent davantage d’UC qu’un simple transfert de requête. Les réponses de service principal lentes augmentent également la consommation.

Important

La capacité n’est pas une mesure directe du nombre de requêtes en cours de traitement.

Pics de la métrique de capacité

La capacité peut également augmenter par intermittence ou être supérieure à zéro, même si aucune requête n’est en cours de traitement. Cela se produit en raison d’actions propres au système ou à la plateforme et ne doit pas être pris en compte lorsque vous envisagez de mettre à l’échelle une instance.

Une métrique de capacité faible ne signifie pas nécessairement que votre instance de gestion des API ne rencontre aucun problème.

Utiliser le Portail Azure pour étudier la capacité

Métrique de capacité

  1. Accédez à votre instance APIM dans le portail Azure.

  2. Dans le menu de gauche, sous Supervision, sélectionnez Métriques.

  3. Sélectionnez la métrique Capacité parmi les métriques disponibles et conservez la valeur d’agrégation Moy par défaut.

    Conseil

    Si vous avez déployé votre instance sur plusieurs emplacements, vous devez toujours examiner une répartition des métriques de capacité par emplacement pour éviter les interprétations incorrectes.

  4. Pour fractionner la métrique par emplacement, dans la section située en haut, sélectionnez Appliquer le fractionnement, puis sélectionnez Emplacement.

  5. Choisissez une plage horaire dans la barre supérieure de la section.

    Vous pouvez définir une alerte Métrique vous permettant de savoir à quel moment un événement inattendu survient. Par exemple, recevez des notifications quand votre instance Gestion des API a dépassé sa capacité maximale attendue pendant plus de 20 minutes.

    Conseil

    Vous pouvez configurer des alertes pour déterminer quand votre service n’a plus assez de capacité ou utiliser la mise à l’échelle automatique d’Azure Monitor pour ajouter automatiquement une unité du service Gestion des API Azure. L’opération de mise à l’échelle peut prendre environ 30 minutes, vous devez donc prévoir vos règles en conséquence.
    Seule la mise à l’échelle de l’emplacement principal est autorisée.

Utiliser la capacité pour les décisions de mise à l’échelle

La capacité est la métrique dont vous devez tenir compte pour prendre des décisions en ce qui concerne la mise à l’échelle d’une instance du service Gestion des API pour accepter une charge plus élevée. Voici quelques considérations générales :

  • Examinez les tendances à long terme et la moyenne.
  • ignorez les pics soudains qui sont la plupart du temps liés à une augmentation de charge (consultez la section Comportement de la métrique de capacité pour plus d’informations).
  • En règle générale, mettez à niveau ou mettez à l’échelle votre instance lorsque la valeur de capacité dépasse 60 % - 70 % pendant une longue période (par exemple, 30 minutes). Des valeurs différentes peuvent être plus adaptées à votre service ou scénario.
  • Si votre instance est configurée avec seulement 1 unité, mettez à niveau ou mettez à l’échelle votre instance lorsque la valeur de capacité dépasse 40 % pendant une longue période. Cette recommandation est basée sur la nécessité de réserver de la capacité pour les mises à jour du système d’exploitation invité dans la plateforme de service sous-jacente.

Conseil

Si vous êtes en mesure d’estimer votre trafic au préalable, testez votre instance Gestion des API sur les charges de travail attendues. Vous pouvez augmenter progressivement la charge de la requête sur votre locataire, afin de déterminer la valeur de la métrique de capacité qui correspond à votre charge de pointe. Suivez les étapes de la section précédente pour utiliser le Portail Azure afin de déterminer la capacité consommée à un moment donné.

Étapes suivantes