Compromis d’excellence opérationnelle pour les charges de travail Power Platform
L’excellence opérationnelle soutient la qualité de la charge de travail grâce à la mise en œuvre de normes d’équipe claires, à une responsabilité et une obligation de rendre compte comprises, à une attention portée aux résultats des clients et à la cohésion de l’équipe. La mise en œuvre de ces objectifs est ancrée dans DevOps, qui recommande de réduire la variance des processus, de réduire les erreurs humaines et, à terme, d’augmenter le retour de valeur pour la charge de travail. Cette valeur ne se mesure pas uniquement par rapport aux exigences fonctionnelles satisfaites par les composants de la charge de travail. Cela se mesure également par la valeur que l’équipe apporte dans ses efforts d’amélioration.
Au cours de la phase de conception d’une charge de travail et tout au long de son cycle de vie, à mesure que des mesures d’amélioration continue sont prises, il est important de prendre en compte la manière dont les décisions basées sur les principes de conception d’excellence opérationnelle et les recommandations de la liste de contrôle de révision de conception pour l’excellence opérationnelle peuvent influencer les objectifs et les optimisations des autres piliers. Certaines décisions peuvent bénéficier à certains piliers, mais constituer des compromis pour d’autres. Cet article décrit des exemples de compromis qu’une équipe de charge de travail peut rencontrer lors de la conception de l’architecture et des opérations de charge de travail.
Compromis en matière d’excellence opérationnelle avec le pilier Fiabilité
Compromis : complexité accrue. La fiabilité donne la priorité à la simplicité, car une conception simple minimise les erreurs de configuration et réduit les interactions inattendues.
Les stratégies de déploiement sécurisées nécessitent souvent un certain degré de compatibilité ascendante et descendante entre la logique de l’application et les données de la charge de travail. Cette complexité supplémentaire augmente la charge de test et peut entraîner des complexités ou des problèmes d’intégrité avec les données de la charge de travail.
Les structures hautement multicouches, modularisées ou paramétrées peuvent augmenter le risque de mauvaise configuration accidentelle en raison de la complexité de l’interaction entre les composants de la charge de travail.
Les modèles de conception de cloud qui profitent aux opérations nécessitent parfois l’introduction de davantage de composants, par exemple l’utilisation d’un magasin secret ou la prise d’une dépendance Application Insights. Les composants supplémentaires augmentent les points d’interaction dans le système, augmentant ainsi le potentiel de dysfonctionnement ou de mauvaise configuration.
Compromis : augmentation des activités potentiellement déstabilisatrices. Le pilier Fiabilité encourage à éviter les activités ou les choix de conception qui peuvent déstabiliser un système et entraîner des perturbations, des pannes ou des dysfonctionnements.
Le déploiement de petits changements progressifs est une technique permettant d’atténuer les risques, mais les utilisateurs s’attendent à ce que ces petits changements soient livrés en production plus fréquemment. Les déploiements peuvent déstabiliser un système, de sorte que ce risque augmente à mesure que le taux de déploiement augmente.
Une culture qui se mesure à l’aide de mesures de vitesse telles que les déploiements hebdomadaires et qui utilise l’automatisation qui peut faciliter l’introduction de changements à un rythme plus rapide est également susceptible d’effectuer davantage de déploiements sur une période plus courte.
L’augmentation de la densité pour simplifier les opérations en réduisant le nombre de points de contrôle et d’observabilité peut également entraîner un risque de disponibilité accru, car un dysfonctionnement ou une mauvaise configuration augmente l’effet d’un événement déstabilisant.
Compromis en matière d’excellence opérationnelle avec le pilier Sécurité
Compromis : surface augmentée. Le pilier Sécurité préconise une surface de charge de travail réduite en termes de composants et d’exposition aux opérations. Cette réduction minimise les vulnérabilités et produit une portée Terminé pour le contrôle et les tests de sécurité.
Les composants qui entourent la charge de travail et prennent en charge ses opérations, comme l’automatisation ou un plan de contrôle personnalisé, doivent également faire l’objet d’un renforcement et de tests de sécurité réguliers.
Les opérations de routine, non planifiées et d’urgence augmentent les points de contact avec la charge de travail. Une approche de confiance zéro exige que ces processus soient considérés comme des vulnérabilités et doivent être inclus dans les contrôles de sécurité et la validation de la charge de travail.
La plate-forme d’observabilité du système collecte des journaux et des mesures sur la charge de travail, qui peuvent constituer une source précieuse de divulgation d’informations. Par conséquent, la sécurité de la charge de travail doit être étendue pour protéger les récepteurs de données contre les menaces internes et externes.
Les agents de build, la configuration externalisée et les magasins de basculement de fonctionnalités augmentent tous la surface d’application qui nécessite une sécurité.
Une fréquence de déploiement plus élevée causée par de petits changements progressifs ou par des efforts de "se mettre à jour et rester à jour" entraîne davantage de tests de sécurité dans le cycle de vie du développement logiciel (SDLC).
Compromis : désir accru de transparence. Une charge de travail sécurisée repose sur des conceptions qui protègent la confidentialité des données qui circulent à travers les composants du système.
Les plateformes d’observabilité ingèrent des données de tous types pour obtenir des informations sur l’état et le comportement d’une charge de travail. Alors que les équipes tentent d’atteindre une plus grande fidélité dans les données d’observabilité, il existe un risque accru que les contrôles de classification des données, comme le masquage des données, des systèmes sources ne s’étendent pas aux journaux et aux récepteurs de journaux de la plateforme d’observabilité.
Compromis : segmentation réduite. Une approche de sécurité clé pour isoler l’accès et la fonction consiste à concevoir une stratégie de segmentation solide. Cette conception est mise en œuvre via l’isolation des ressources et des contrôles d’identité.
La colocalisation de composants d’application disparates dans des environnements et des ressources de données partagés pour faciliter la gestion inverse la segmentation ou rend la segmentation basée sur les rôles plus difficile à réaliser. Les composants colocalisés peuvent également devoir partager une identité de charge de travail, ce qui peut entraîner une attribution excessive d’autorisations ou un manque de traçabilité.
La collecte de tous les journaux du système dans un récepteur de journaux unifié peut faciliter l’interrogation et la création d’alertes. Cependant, cela peut également rendre plus difficile, voire impossible, la fourniture d’une sécurité basée sur les lignes pour traiter les données sensibles avec les contrôles d’audit requis.
Simplifier la gestion de la sécurité basée sur les attributs ou sur les rôles en réduisant la granularité des rôles et de leurs attributions peut conduire à des autorisations inappropriées.
Compromis en matière d’excellence opération avec le pilier Optimisation de l’expérience
Compromis : priorités concurrentes. Le pilier Optimisation de l’expérience recommande un état d’esprit axé sur l’utilisateur.
Le développement de l’expérience utilisateur qui nécessite des ressources importantes peut être dépriorisé, ce qui peut entraîner un manque de convivialité, d’interactions et de conception visuelle dont les utilisateurs de la charge de travail ont besoin.
Le développement de l’interface utilisateur nécessite souvent des itérations et des cycles de livraison plus rapides, ce qui peut mettre à rude épreuve les processus SDLC de l’équipe.
Compromis entre excellence opérationnelle et efficacité des performances
Compromis : utilisation accrue des ressources. Le pilier Efficacité des performances recommande d’allouer autant de ressources de calcul et de réseau disponibles que possible aux exigences de la charge de travail.
- Le cadre de surveillance d’une charge de travail exige que les composants de l’architecture allouent du temps et des ressources pour créer, collecter et diffuser des journaux et des métriques. Ces points de données permettent de garantir qu’une alerte et une surveillance efficaces sont possibles pour la fiabilité, la sécurité et les performances. À mesure que le niveau d’instrumentation augmente, la pression sur les ressources du système pourrait également augmenter.
Compromis : latence accrue. Pour créer des charges de travail performantes, les équipes recherchent des moyens de réduire le temps et les ressources que les charges de travail consomment pour effectuer leurs tâches.
- Certains modèles de conception de cloud qui prennent en charge les approches de "changement indépendant au fil du temps" pour soutenir les idéaux d’amélioration progressive peuvent introduire une latence due à la traversée de composants supplémentaires.