Supervisión de un entorno de nube
Necesita observabilidad del entorno en la nube para garantizar que las cargas de trabajo se ejecuten sin problemas, ya sea propietario de la empresa, propietario de la plataforma o propietario de la aplicación. Debe saber si:
- Las aplicaciones están disponibles y si realizan las expectativas de los clientes.
- Tiene cualquier amenaza de seguridad que requiera investigación.
- Los costos de consumo están dentro del intervalo esperado.
La supervisión es el proceso de recopilación, análisis y acción en la telemetría que indica el estado de la plataforma, los recursos y las aplicaciones. Un entorno de supervisión eficaz incluye todo el patrimonio de la nube, que puede incluir recursos en varias nubes y entornos locales.
La observabilidad es una propiedad de un sistema que mide el estado interno que se puede deducir de sus salidas externas. Debe implementar servicios y procesos para supervisar el entorno en la nube. Y debe tener la capacidad de observar y comprender el comportamiento de los servicios que se ejecutan en la nube.
Ventajas de la supervisión
Invierta en su entorno de supervisión para obtener las siguientes ventajas en varios aspectos de la nube:
Disponibilidad y rendimiento: supervise los recursos para ayudar a garantizar que los servicios en la nube y las aplicaciones estén disponibles y funcionen según lo previsto. Para identificar y responder a problemas antes de que afecten a los usuarios, realice un seguimiento de las métricas clave y configure reglas de alerta.
Optimización de costos: use la supervisión para realizar un seguimiento del uso de los recursos y escalar los recursos según la demanda. Este enfoque ayuda a evitar recursos sobreaprovisionados y infrautilizados, lo que optimiza el costo. La supervisión también puede identificar y avisarle de cualquier saturación de costos o picos inesperados en el uso.
Cumplimiento: use la supervisión para mantener registros y registros de actividades, lo que ayuda a garantizar que los servicios en la nube cumplan las directivas y las regulaciones. Los informes que usan estos datos pueden ayudar con auditorías periódicas y comprobaciones de cumplimiento.
Seguridad: implemente la supervisión continua para ayudar a detectar amenazas de seguridad y vulnerabilidades para que pueda actuar inmediatamente para proteger los datos y los recursos. También puede analizar los datos recopilados para la detección y respuesta de amenazas.
Supervisión de plataformas
Una estrategia de supervisión eficaz incluye todas las plataformas del entorno informático. Además de Azure, es posible que tenga recursos locales, multinube y perimetrales. Cada recurso requiere los mismos niveles de supervisión. Siga las instrucciones de Cloud Adoption Framework para Azure e incluya la supervisión en la estrategia de operaciones unificadas. En esta estrategia, la nube principal hospeda las herramientas de supervisión y otras herramientas de administración. Las herramientas de supervisión supervisan todos los recursos en todas las plataformas.
Tipos de supervisión
La supervisión es una materia multifacética que requiere una combinación de herramientas, procesos y prácticas. En la tabla siguiente se desglosan varios tipos de supervisión. Diferentes servicios y características pueden proporcionar diferentes combinaciones de estos tipos de supervisión. Pero un entorno de supervisión completo incluye todos estos tipos de supervisión en cada una de las plataformas del entorno informático.
Tipo | Descripción |
---|---|
Infraestructura | La supervisión de la infraestructura incluye el rendimiento y la disponibilidad de los recursos en la nube, como máquinas virtuales, recursos de almacenamiento y redes. Este tipo de supervisión ayuda a garantizar que las funciones de infraestructura subyacentes funcionen de forma óptima, lo que ayuda a mantener la disponibilidad y el rendimiento de las aplicaciones que dependen de ella. |
Supervisión del rendimiento de aplicaciones (APM) | APM supervisa el rendimiento y la disponibilidad de las aplicaciones que se ejecutan en la nube. Realiza un seguimiento de las métricas, como los tiempos de respuesta, las tasas de error y los volúmenes de transacciones. APM identifica cuellos de botella de rendimiento y ayuda a garantizar que las aplicaciones cumplan las expectativas del usuario. |
Base de datos | La supervisión de bases de datos realiza un seguimiento del rendimiento, la disponibilidad y el consumo de recursos de las bases de datos en la nube. Entre las métricas clave se incluyen el rendimiento de las consultas, el uso del índice y el estado de bloqueo. |
Red | La supervisión de red realiza un seguimiento del rendimiento y la disponibilidad de los componentes de red en el entorno de nube. Las métricas incluyen el uso del ancho de banda, la latencia y la pérdida de paquetes. |
Seguridad | La supervisión de seguridad realiza un seguimiento de los eventos de seguridad y las vulnerabilidades dentro del entorno en la nube, como el acceso no autorizado, el malware y las infracciones de cumplimiento. La supervisión de seguridad eficaz ayuda a proteger los datos confidenciales, a garantizar el cumplimiento de los requisitos normativos y a evitar costosas infracciones de seguridad. |
Cumplimiento normativo | La supervisión del cumplimiento ayuda a garantizar que el entorno en la nube cumpla los estándares normativos y del sector. Realiza un seguimiento de las configuraciones, los controles de acceso y las prácticas de control de datos para ayudar a garantizar el cumplimiento de las normativas pertinentes. |
Costos | La supervisión de costos realiza un seguimiento del gasto en la nube y el uso de recursos para identificar las oportunidades de ahorro de costos y evitar saturaciones presupuestarias. Supervisa el uso de recursos, identifica los recursos infrautilizados y optimiza las configuraciones de recursos para ayudar a reducir los costos. |
Responsabilidades compartidas
En un entorno local, es responsable de todos los aspectos de la supervisión porque posee y administra todos los recursos informáticos. En la nube, compartirá esta responsabilidad con su proveedor de nube. En función del tipo de modelo de implementación que elija, las responsabilidades de supervisar varias capas de la pila de nube pueden transferirse de usted al proveedor de nube.
En una implementación de infraestructura como servicio (IaaS), el proveedor de nube supervisa la plataforma en la nube subyacente, como la infraestructura física y la capa de virtualización. Además, supervisa el sistema operativo, las aplicaciones y los datos que se ejecutan en las máquinas virtuales que se implementan en la plataforma en la nube. Cuando el modelo de implementación se mueve hacia arriba, el proveedor de nube asume más responsabilidad para supervisar el entorno. Esta responsabilidad culmina en una implementación de software como servicio (SaaS) porque transfiere la responsabilidad de supervisión al proveedor de nube para toda la pila, incluida la aplicación y los datos.
Puede usar herramientas de supervisión del proveedor de nube para supervisar las capas de la pila, pero es responsable de configurar estas herramientas y analizar los datos que recopilan. Debe conceder acceso a varios miembros de su organización y crear paneles y alertas para ayudarles a distinguir información crítica. Es posible que también tenga que integrar estos componentes con otras herramientas y sistemas de vales que usa su organización.
El proveedor de nube debe realizar los mismos tipos de servicio para sus capas de la pila que proporcione a los clientes internos. Deben supervisar continuamente el estado y el rendimiento de la plataforma que contraen a usted. Proporcionan paneles y alertas para notificarle de forma proactiva cualquier problema de servicio. Al igual que los clientes internos, no necesita visibilidad sobre los detalles de cómo supervisa el proveedor de nube su plataforma, solo que cumplen los contratos de nivel de servicio que contrae con ellos.
Roles y responsabilidades
La mayoría de las organizaciones empresariales tienen un equipo de operaciones centralizado que supervisa el estado general y el rendimiento del entorno en la nube.
Normalmente, este equipo:
- Establece las estrategias para la empresa general.
- Realiza la configuración centralizada del entorno de supervisión.
- Delega permisos a las partes interesadas de su organización que requieren acceso a los datos de supervisión relacionados con sus aplicaciones y servicios.
Las organizaciones tienen varios roles que mantienen el entorno de supervisión y que requieren acceso a los datos de supervisión para realizar sus funciones de trabajo. Cada rol tiene requisitos diferentes para supervisar los datos en función de sus responsabilidades particulares. En función del tamaño de la organización, es posible que tenga varias personas que rellenen cada rol o que tenga una persona que rellene varios roles.
Las organizaciones individuales pueden distribuir las responsabilidades de forma diferente. En la tabla siguiente se muestra un ejemplo de los roles y responsabilidades de una organización típica.
Role | Descripción |
---|---|
Arquitecto de la nube | El arquitecto de la nube diseña y supervisa la infraestructura en la nube para ayudar a garantizar que cumple los objetivos empresariales de la organización. El arquitecto de la nube se centra en la confiabilidad, la seguridad y la escalabilidad de la arquitectura en la nube. Requieren telemetría de alto nivel para obtener una vista holística del patrimonio digital. Esta telemetría incluye métricas de uso de recursos, métricas de APM, información de costos y facturación e informes de cumplimiento. |
Ingeniero de plataformas | El ingeniero de plataforma crea y administra la plataforma que los desarrolladores usan para implementar sus aplicaciones. El ingeniero de plataforma puede crear canalizaciones de integración continua y entrega continua (CI/CD), administrar la infraestructura en la nube como código (IaC) y garantizar la escalabilidad y confiabilidad de la plataforma. El ingeniero de plataforma requiere telemetría sobre el estado operativo de la plataforma. Esta telemetría incluye métricas de rendimiento de contenedores, registros de orquestación, validación de IaC y disponibilidad del servicio. |
Administrador del sistema | El administrador del sistema administra y mantiene servidores, sistemas operativos y otros componentes de infraestructura en la nube. Realizan copias de seguridad, solucionan problemas y garantizan que los sistemas estén actualizados. El administrador del sistema requiere telemetría de nivel de sistema operativo y servidor, incluidos el uso de CPU, memoria y disco, rendimiento de red y registros del sistema. |
Ingeniero de seguridad | El ingeniero de seguridad implementa y administra medidas de seguridad para ayudar a proteger los datos y las aplicaciones frente a amenazas. El ingeniero de seguridad controla todo, desde la administración de identidades hasta la detección y respuesta de amenazas. Usan telemetría sobre eventos de seguridad, incluidos los registros de acceso, las alertas de detección de amenazas, las evaluaciones de vulnerabilidades y las métricas de cumplimiento. |
Administrador de red | El administrador de red administra y mantiene la red en la nube para ayudar a garantizar que los datos fluyen de forma segura y eficaz entre servidores, aplicaciones y usuarios. El administrador de red controla las configuraciones de red, supervisa el rendimiento e implementa medidas de seguridad. Requieren telemetría centrada en la red, incluidos el análisis del tráfico de red, las medidas de latencia, la pérdida de paquetes y los registros de firewall. |
Administrador de bases de datos (DBA) | DBA administra y mantiene bases de datos para ayudar a garantizar la integridad, el rendimiento y la disponibilidad de los datos. El DBA controla las copias de seguridad y la recuperación de bases de datos y optimiza las consultas para mejorar la eficacia. Usan telemetría sobre el rendimiento e integridad de la base de datos, incluidas las métricas de rendimiento de las consultas, los tiempos de respuesta de la base de datos, los registros de transacciones y el estado de copia de seguridad o recuperación. |
Desarrollador | El desarrollador diseña, escribe, prueba y mantiene el software que se ejecuta en plataformas en la nube. El desarrollador crea características y corrige errores para asegurarse de que la aplicación sigue siendo segura y funciona bien. Requieren telemetría específica de la aplicación, incluidas las tasas de error, la latencia, los tiempos de respuesta, el análisis de comportamiento del usuario y las métricas de uso de características. |
Facilitación de Azure
Azure tiene muchos servicios que admiten los diferentes tipos de supervisión que necesita en su entorno de nube. Cada servicio tiene como destino uno o varios roles. Combine los servicios para proporcionar las características que necesita para un entorno de supervisión completo.
Servicio | Descripción | Tipo | Roles |
---|---|---|---|
Azure Monitor | Azure Monitor está en el centro del ecosistema de supervisión de Azure. Es una solución de supervisión completa que puede usar para recopilar, analizar y responder a los datos de supervisión de los entornos locales y en la nube. Azure Monitor proporciona una supervisión completa de la infraestructura, la red y las aplicaciones. También proporciona una plataforma de datos y características principales, como análisis de datos, visualización y alertas para otros servicios. | Infraestructura base de datos compliance |
Arquitecto de la nube, ingeniero de plataforma, administrador del sistema, DBA |
Application Insights | Application Insights es una característica de Azure Monitor que proporciona supervisión de APM para las aplicaciones en la nube. | APM | Desarrollador |
Azure Network Watcher | Network Watcher proporciona funcionalidades de supervisión y visualización para los recursos de red en Azure. Use este servicio para supervisar, diagnosticar y ver las métricas. También puede habilitar o deshabilitar los registros de los recursos de una red virtual de Azure. | Red | Administrador de red |
Microsoft Sentinel | Microsoft Sentinel es una solución de administración de eventos de información de seguridad (SIEM) nativa de la nube y respuesta automatizada de orquestación de seguridad (SOAR). Ingiere telemetría de seguridad de los recursos de Azure y otros componentes para proporcionar detección de amenazas cibernéticas, investigación, respuesta y búsqueda proactiva. | Seguridad | Ingeniero de seguridad |
Microsoft Defender XDR | Defender XDR incluye soluciones de seguridad de Microsoft nativas de la plataforma Azure, sistemas operativos cliente y servidor de Microsoft, así como aplicaciones como Office 365, Exchange Online y SharePoint en Microsoft 365. Cada solución de seguridad usa inteligencia artificial y aprendizaje automático para correlacionar la telemetría y determinar si es necesario realizar investigaciones. Cuando detectan un comportamiento inaceptable, toman medidas para evitar interrupciones. | Seguridad | Ingeniero de seguridad |
Microsoft Cost Management | Cost Management es un conjunto de herramientas que puede usar para analizar, supervisar y optimizar los costos de Microsoft Cloud. Cost Management está disponible para cualquier persona que tenga acceso a una cuenta de facturación, una suscripción, un grupo de recursos o un grupo de administración. | Costos | Arquitecto de la nube |
Azure Service Health | Service Health proporciona un estado de mantenimiento de los servicios en los que dependen los recursos de Azure. Puede informarle de cualquier interrupción del servicio y proporcionar una vista personalizada del estado de los servicios y regiones de Azure. | Infraestructura | Proveedor de servicios en la nube |