Opérations de plateforme en gestion cloud
Une base de référence de gestion cloud qui comprend l’inventaire et la visibilité, la conformité opérationnelle et la protection et la récupération fournit dans certains cas un niveau de gestion cloud suffisant pour la plupart des charges de travail d’un portefeuille informatique. Toutefois, la base de référence suffit rarement à prendre en charge l’intégralité du portefeuille. Cet article s’appuie sur les opérations de portefeuille, qui correspondent le plus souvent à l’étape d’après dans la gestion cloud.
Une étude rapide des ressources du portefeuille informatique met en évidence les motifs existants dans les charges de travail prises en charge. Dans ces charges de travail, il y a des plateformes courantes. Ces plateformes peuvent être très différentes en fonction des décisions techniques qui ont été prises au sein de l’entreprise.
Certaines organisations sont très dépendantes de SQL Server, d’Oracle ou d’autres plateformes de données open source. Dans d’autres, les points communs se trouvent au niveau des plateformes d’hébergement des machines virtuelles ou des conteneurs. D’autres encore peuvent avoir une dépendance commune à des applications ou à des systèmes ERP (Enterprise Resource Planning) comme SAP ou Oracle.
En prenant connaissance de ces similitudes, votre équipe de gestion cloud peut se spécialiser dans des niveaux supérieurs de support pour ces plateformes prioritaires.
Établir un catalogue de services
L’objectif des opérations de plateforme est de créer des solutions fiables et reproductibles pour l’équipe d’adoption du cloud. L’équipe d’adoption du cloud peut ensuite fournir une plateforme avec un haut niveau d’engagement métier. Cet engagement est susceptible de réduire la probabilité ou la fréquence des temps d’arrêt, ce qui améliore la fiabilité. En cas de défaillance du système, l’engagement peut également limiter la quantité de données perdues et le délai de récupération. Il comprend souvent des opérations centralisées et régulières qui viennent soutenir la plateforme.
Quand l’équipe de gestion cloud établit des niveaux plus hauts de gestion et de spécialisation des opérations pour certaines plateformes, ces plateformes sont ajoutées à un catalogue de services. Le catalogue de services permet le déploiement en libre-service des plateformes dans une configuration spécifique, qui respecte les opérations de plateforme continues. Quand elles discutent de l’alignement de l’entreprise, les équipes de gestion cloud et de stratégie cloud peuvent proposer des solutions du catalogue de services à l’entreprise. Les solutions du catalogue de services améliorent la fiabilité, la durée de fonctionnement et les engagements de récupération grâce à un processus contrôlé et reproductible.
Pour information, certaines organisations appellent liste approuvée la première version du catalogue de services. La principale différence réside dans le fait qu’un catalogue de services s’accompagne des engagements opérationnels permanents du Cloud Center of Excellence (CCoE). Une liste approuvée est similaire. C’est une liste préapprouvée de solutions qu’une équipe peut utiliser dans le cloud. Toutefois, il n’y a en général pas d’avantages opérationnels associés aux applications d’une liste approuvée.
Comme avec l’informatique centralisée et le Cloud Center of Excellence (CCoE), la différence se situe au niveau de priorités. Un catalogue de services suppose une bonne intention, mais il fournit une barrière de sécurité au niveau des opérations, de la gouvernance et de la sécurité, ce qui accélère l’innovation. Une liste approuvée entrave l’innovation tant que les portes des opérations, de la conformité et de la sécurité ne sont pas franchies pour une solution donnée. Les deux solutions sont viables, mais elles obligent l’entreprise à prendre des décisions subtiles concernant les priorités, afin d’investir davantage dans l’innovation ou bien dans la conformité.
Créer le catalogue de services
La gestion cloud est rarement efficace pour fournir un catalogue de services dans un silo. Un partenariat est nécessaire au sein de l’équipe informatique centrale ou du CCoE pour développer un catalogue adéquat. Cette approche est généralement plus efficace lorsqu’une organisation informatique atteint un niveau de maturité CCoE, même si elle peut être implémentée plus tôt.
Quand l’équipe de plateforme cloud crée le catalogue de services dans un modèle CCoE, elle crée la plateforme à l’état souhaité. Les équipes chargées de la gouvernance et de la sécurité cloud valident la gouvernance et la conformité au sein du déploiement. L’équipe de gestion cloud établit des opérations en cours pour cette plateforme. L’équipe chargée de l’automatisation cloud crée un package pour la plateforme afin de permettre un déploiement scalable et reproductible.
Une fois la plateforme mise en package, l’équipe de gestion cloud peut l’ajouter au catalogue de services. L’équipe d’adoption du cloud utilise alors le package ou d’autres packages du catalogue pendant le déploiement. Une fois la solution mise en production, l’entreprise bénéficie des avantages supplémentaires que présentent l’amélioration de la gestion opérationnelle et la potentielle réduction des interruptions de l’activité.
Remarque
La création d’un catalogue de services nécessite beaucoup d’efforts et de temps pour plusieurs équipes. L’utilisation du catalogue de services ou de la liste approuvée comme mécanismes de portes ralentit l’innovation. Quand l’innovation est une priorité, développez des catalogues de services parallèlement aux autres efforts d’adoption.
Définir ses propres opérations de plateforme
Bien que les outils et les processus de gestion puissent améliorer les opérations de plateforme, ils restent souvent insuffisants pour atteindre les états de stabilité et de fiabilité souhaités. De véritables opérations de plateforme exigent de se concentrer sur les piliers de l’excellence de l’architecture. Quand une plateforme justifie un investissement plus important au niveau des opérations, prenez en compte les cinq principes suivants avant d’introduire la plateforme dans un catalogue de services :
- Fiabilité : concevez les systèmes de manière à ce qu'ils récupèrent après des défaillances et continuent de fonctionner.
- Sécurité : protégez les applications et les données contre les menaces.
- Optimisation des coûts : gérez les coûts pour une valorisation maximale.
- Excellence opérationnelle : suivez les processus opérationnels assurant l'exécution d'un système en production.
- Efficacité des performances : mettez les systèmes à l'échelle pour les adapter aux changements de charge.
Microsoft Azure Well-Architected Framework fournit une approche pour évaluer si des charges de travail spécifiques respectent ces principes, afin d’améliorer les opérations en général. Vous pouvez appliquer ces principes aussi bien aux opérations de plateforme qu’aux opérations de charge de travail.
Bien démarrer avec des plateformes spécifiques
Les plateformes abordées dans les sections suivantes, courantes chez les clients Azure classiques, peuvent facilement justifier un investissement dans les opérations de plateforme. Les équipes de gestion cloud ont tendance à commencer par ces plateformes lorsqu’elles élaborent des exigences d’opérations de plateforme ou un catalogue de services complet.
Opérations de données PaaS
Les données constituent souvent la première plateforme qui garantit les investissements en opérations de plateforme. Lorsque les données sont hébergées dans un environnement PaaS (Platform as a service), les parties prenantes de l’entreprise ont tendance à demander un objectif de point de récupération (RPO) relativement bas afin de réduire la perte de données. Selon la nature de l’application, elles peuvent également requérir une réduction de l’objectif de temps de récupération (RTO). Dans les deux cas, l’architecture des solutions de données PaaS peut facilement permettre un niveau accru de soutien à la gestion.
Dans la plupart des scénarios, le coût d’amélioration des engagements de gestion est facilement justifié, même pour les applications non stratégiques. Cette amélioration des opérations de plateforme est si courante que de nombreuses équipes de gestion cloud la voient plus comme une base de référence améliorée que comme un véritable perfectionnement des opérations de plateforme.
Opérations de données IaaS
Quand les données sont hébergées dans une solution IaaS (Infrastructure as a service) classique, l’effort d’amélioration du RPO et du RTO peut être supérieur. Pourtant, la volonté des parties prenantes de l’entreprise d’atteindre de meilleurs engagements de gestion est rarement affectée par le choix entre une solution PaaS et une solution IaaS. En fait, le fait de prendre connaissance des différences fondamentales d’architecture peut amener l’entreprise à exiger des solutions PaaS ou des engagements qui correspondent aux caractéristiques des solutions PaaS. La modernisation des plateformes de données IaaS doit être la première étape des opérations de plateforme.
Lorsque la modernisation n’est pas possible, les équipes de gestion cloud donnent généralement la priorité aux plateformes de données IaaS, en les considérant comme le premier service obligatoire du catalogue de services. Lorsque l’entreprise a le choix entre des serveurs de données autonomes et des solutions de données en cluster haute disponibilité, l’animation des discussions concernant ses engagements s’en trouve grandement facilitée. Une fois que l’entreprise a compris les améliorations opérationnelles et l’augmentation des coûts, elle est plus à même de prendre la meilleure décision en ce qui concerne les processus métier et les charges de travail associées.
Autres opérations de plateforme courantes
En plus des plateformes de données, les hôtes de machines virtuelles constituent souvent une plateforme commune pour les améliorations d’opérations. Les équipes chargées de la gestion cloud et des plateformes cloud investissent la plupart du temps dans l’amélioration des hôtes VMware ou des solutions de conteneur. Ces investissements peuvent améliorer la stabilité et la fiabilité des hôtes qui gèrent les machines virtuelles, qui elles font tourner les charges de travail. Le bon fonctionnement d’un hôte ou d’un conteneur est susceptible d’améliorer le RPO ou le RTO de plusieurs charges de travail. Cette approche crée des engagements métier améliorés, mais elle répartit l’investissement. Le perfectionnement des engagements comme la réduction des coûts facilitent grandement la justification des améliorations apportées à la gestion cloud et aux opérations de plateforme.
Étapes suivantes
Parallèlement à l’amélioration des opérations de plateforme, les équipes de gestion cloud se concentrent sur le perfectionnement des opérations de charge de travail des premiers 20 % (ou moins) parmi les meilleures charges de travail de production.