Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Este artículo le ayuda a establecer y mantener operaciones eficaces para administrar el patrimonio en la nube de Azure. Las operaciones en la nube correctas requieren responsabilidades y procesos claramente definidos para cada área de administración de la nube.
Identificación de las responsabilidades de administración
La administración eficaz del entorno de Azure implica responsabilidades centrales (en toda la plataforma) y responsabilidades de carga de trabajo. Las responsabilidades centrales respaldan toda tu infraestructura en la nube de Azure. Las responsabilidades relacionadas con la carga de trabajo se centran en una carga de trabajo individual. Utilice la Tabla 1 para asegurarse de que sus operaciones cubran las responsabilidades esenciales de las operaciones en la nube.
Tabla 1. Responsabilidades de administración de la nube principal
Áreas de administración de la nube | Responsabilidades centrales | Responsabilidades de carga de trabajo |
---|---|---|
Conformidad | ▪ Defina los procedimientos operativos. ▪ Aplique directivas de gobernanza. ▪ Supervise el cumplimiento y corrija o escale según sea necesario. |
▪ Siga los procedimientos operativos. ▪ Alinee el diseño con las directivas de gobernanza. |
Seguridad | ▪ Gestione las operaciones de seguridad de toda la organización . ▪ Administre identidades en Microsoft Entra ID. ▪ Conceda acceso a las suscripciones de Azure. ▪ Defina y mantenga las líneas base de seguridad a través de Azure Policy y Microsoft Defender for Cloud. ▪ Supervise la integración de la protección contra amenazas y la respuesta a incidentes con Microsoft Sentinel. |
▪ Implemente el diseño seguro de carga de trabajo . ▪ Responder a incidentes e alertas de seguridad específicas de la carga de trabajo. ▪ Evalúe continuamente las vulnerabilidades dentro de la carga de trabajo. |
Administración de recursos | ▪ Defina y mantenga la jerarquía de recursos . ▪ Cree suscripciones de carga de trabajo según sea necesario. ▪ Defina la estrategia de nomenclatura y etiquetado. ▪ Defina la topología de red. ▪ Configure redes compartidas (emparejamiento de redes virtuales, conectividad local). ▪ Administrar recursos o servicios compartidos entre diferentes cargas de trabajo. ▪ Monitoree los límites de la suscripción y gestione las solicitudes de aumentos de cuota. |
▪ Administre suscripciones específicas de carga de trabajo (si se delegaron). ▪ Administre grupos de recursos y recursos para cada carga de trabajo. ▪ Cumplir y aplicar estándares de nomenclatura y etiquetado. ▪ Administre el uso de recursos de nivel de aplicación, lo que garantiza que los recursos permanecen dentro de las cuotas de suscripción. |
Despliegue | ▪ Normalice y gestione canalizaciones y herramientas de CI/CD (Azure DevOps y GitHub Actions). ▪ Defina plantillas de infraestructura como código de referencia (Bicep, Terraform y plantillas ARM). ▪ Proporcione procedimientos recomendados centrales para la seguridad de la canalización (análisis de código, administración de secretos). |
▪ Utilice el marco central de CI/CD y las plantillas de IaC para implementar cargas de trabajo. ▪ Implemente tareas de implementación específicas de la carga de trabajo (configure la configuración de la aplicación, la base de datos). ▪ Adapte las plantillas de referencia a las necesidades de carga de trabajo al tiempo que respeta las directrices centrales. |
Desarrollo | ▪ Proporcionar y aplicar cadenas de herramientas y marcos de desarrollo estandarizados para acelerar la coherencia (estándares de codificación, procedimientos recomendados de DevOps). ▪ Mantenga repositorios internos o fuentes de paquetes para bibliotecas o módulos compartidos. |
▪ Adopte y adapte las cadenas de herramientas estándar para el desarrollo de cargas de trabajo. ▪ Posee el ciclo de vida de la aplicación e incorpora procedimientos recomendados (pruebas unitarias, pruebas de integración). ▪ Gestione la mejora continua para la base de código de la carga de trabajo. |
Monitorización | ▪ Planifique la estrategia de supervisión. ▪ Envíe alertas sobre las responsabilidades centralizadas. ▪ Proporcione paneles para métricas operativas comunes en todo el entorno. |
▪ Monitorear la carga de trabajo ▪ Amplíe o ajuste las alertas centrales para capturar condiciones específicas de la carga de trabajo. ▪ Investigue y corrija incidentes de nivel de carga de trabajo en función de las alertas y los registros. |
Costos | ▪ Asignar presupuestos globales o de nivel de suscripción a la nube ▪ Supervise el gasto en la nube en toda la organización y elabore informes de costes. ▪ Asigne costos a unidades de negocio o productos, normalmente mediante etiquetas o modelos de asignación de costos personalizados. ▪ Aplicar la estrategia de etiquetado para la asignación de costos. |
▪ Diseñe cargas de trabajo de optimización de costes ▪ Respetar las restricciones presupuestarias. |
Fiabilidad | ▪ Defina requisitos de confiabilidad (SLO, RPO y RTO) por prioridad de carga de trabajo. ▪ Proporcione instrucciones sobre la continuidad empresarial y la recuperación ante desastres (BCDR). ▪ Administre soluciones centralizadas de recuperación ante desastres . ▪ Apoyar la gestión de incidentes graves en todas las cargas de trabajo. |
▪ Diseñe cargas de trabajo para cumplir con los requisitos de confiabilidad. |
Rendimiento | ▪ Supervise y mantenga el rendimiento en componentes centralizados (red central, servicios compartidos). ▪ Proporcione instrucciones para la optimización del rendimiento y el planeamiento de la capacidad. ▪ Supervisión de la cuota |
▪ Diseñe cargas de trabajo para la eficiencia del rendimiento. |
Establecimiento de las operaciones en la nube
Use las responsabilidades descritas en tabla 1 para crear una base operativa eficaz. Defina claramente los equipos, los estándares y los procesos siguiendo estos pasos:
Definir el modelo de operaciones en la nube. Elija un modelo de administración centralizado o compartido basado en el tamaño y la madurez de la organización, descrito en la tabla siguiente:
Enfoque de operaciones Responsabilidades y ámbito Más adecuado para Ventajas Contras Centralizado Un único equipo administra todas las tareas. Startups o pequeña presencia en la nube. Simplifica la administración en la nube. Riesgos que crean cuellos de botella. Administración compartida Equipos centrales de plataforma y de carga de trabajo separados Organizaciones con diversas cargas de trabajo. Equilibra la gobernanza y la agilidad. Requiere una asignación clara de responsabilidad Establecer responsabilidades centrales. Formar un equipo dedicado para controlar las tareas de administración central. Desarrolle una matriz de aptitudes de la tabla 1 para identificar la experiencia necesaria.
Establecer responsabilidades de carga de trabajo. Configurar equipos especializados para tareas específicas de la carga de trabajo. A continuación, identifique las responsabilidades usando la Tabla 1 , luego reclute en consecuencia.
Realizar una revisión de Azure Well-Architected. Use la herramienta de evaluación de Well-Architected para volver a evaluar cada carga de trabajo mientras desarrolla y prueba los cambios de diseño.
Use el marco de Azure Well-Architected. Utilice el pilar de Excelencia Operacional para guiar sus responsabilidades para gestionar cargas de trabajo.
Asignar responsabilidad. Designe propietarios específicos para todas las responsabilidades de administración en la nube. En un modelo de administración compartida, los equipos de carga de trabajo deben tener autonomía para administrar sus suscripciones.
Documentar las operaciones en la nube
Documente claramente las operaciones en la nube para permitir una respuesta de crisis eficaz y una implementación fluida de los cambios. Establezca procedimientos generales y cree guías detalladas para tareas frecuentes y específicas.
Documentar procedimientos operativos
Defina procedimientos operativos para administrar las tareas de cambio, recuperación ante desastres y mantenimiento rutinario que la automatización no puede controlar. Siga estos pasos:
Definir procedimientos de administración de cambios. Cambio es la causa principal del error en la nube. Desarrolle un proceso estandarizado para administrar los cambios para evitar errores en el entorno de nube. Consulte Administración de cambios.
Definir procedimientos de implementación (administración de versiones). Para mantener una configuración coherente, normalice las implementaciones, las versiones y las promociones de entorno. Ver Administración de implementaciones.
Definir procedimientos de recuperación ante desastres y continuidad empresarial. Para controlar posibles errores, prepare un plan de respuesta estandarizado. Consulte Administración de la recuperación ante desastres y la continuidad empresarial.
Definir procedimientos adicionales. procesos de documento para administrar solicitudes de servicio, aplicación de revisiones y administración de configuración. Documente claramente estos procesos para asegurarse de que las partes interesadas saben cómo iniciar o completar cada tarea.
Documentación de guías operativas
Cree guías detalladas paso a paso (manuales de operación o manuales de estrategias) para tareas operativas clave. Esta preparación garantiza una ejecución coherente, mejora la eficacia y reduce los tiempos de resolución durante los eventos críticos.
Definir tareas diarias. Preparar manuales que abarcan responsabilidades diarias, como solicitudes de escalación de privilegios y revisiones de registros. Establezca procedimientos operativos estándar (SOP) para supervisar métricas, umbrales de alerta y paneles para cada sistema.
Crear una biblioteca de runbooks centrados en Azure. Crear runbooks específicos de Azure para abordar escenarios como:
Escenario Ejemplo Uso elevado de CPU Administración del escalado vertical en Azure App Service Conmutación por error y conmutación por recuperación Conmutación por error y conmutación por recuperación en Azure Site Recovery Implementaciones azules y verdes Implementación azul/verde en Azure Front Door Restauración de copia de seguridad Restauración de copia de seguridad en Azure Blob Storage y Azure Cosmos DB Almacenar estos manuales de operación en un repositorio central. Mantener los manuales de operación en un repositorio central accesible para los ingenieros de guardia para su uso inmediato durante incidentes.
Implementar operaciones mediante programación. Integrar la infraestructura como código en los runbooks para implementar recursos comunes de forma coherente y precisa cada vez.
Revisar y actualizar. Revisar y actualizar periódicamente la documentación para reflejar los ajustes operativos y las actualizaciones de los servicios en la nube.
Herramientas y soluciones de documentos
La documentación clara garantiza la coherencia, reduce los riesgos operativos y mejora la eficacia del equipo. Cree y mantenga una documentación completa para las herramientas en la nube. Actualice periódicamente la documentación para reflejar las prácticas actuales y garantizar una accesibilidad sencilla para todos los miembros del equipo.
Área | Ventajas de ejemplo |
---|---|
Integración | La estandarización simplifica las integraciones mediante la consolidación de registros y repositorios de código. |
Automatización | Reutilice plantillas de IaC en equipos, scripts de automatización y mejores prácticas en todos los proyectos. |
Administración de incidentes | Capture problemas y genere acciones de corrección que se integren en ciclos de versión. |
Administración de las operaciones en la nube
La administración en la nube eficaz optimiza la eficacia operativa, reduce el tiempo de inactividad y aclara los roles y las responsabilidades. Normalice las operaciones en la nube a través de procesos de automatización y soporte estructurado. Siga estas directrices operativas:
Proporcionar compatibilidad continua con la nube. Establezca la cobertura de soporte técnico del 24/7 a través de equipos globales que adoptan un modelo de seguimiento del sol o rotaciones estructuradas en las llamadas. Defina claramente las responsabilidades para garantizar la respuesta oportuna y la resolución de incidentes críticos. Configure alertas automatizadas para notificar inmediatamente al personal de soporte técnico designado.
Automatizar el trabajo repetitivo. Use las funcionalidades de Automatización de Azure para minimizar los procesos manuales y reducir la sobrecarga operativa. Automatice las actividades rutinarias para eliminar errores, simplificar los flujos de trabajo y permitir que los equipos se centren en prioridades estratégicas.
Caso de uso Ejemplos Automatización Automatice los flujos de trabajo en Azure Boards o en el sistema ITSM. Plantillas para los elementos de trabajo "Solicitud de cambios" e "Incidente". Respuesta ante incidentes Para generar automáticamente tickets de incidentes con campos estándar completados, integre Azure Monitor y Azure Service Health con el sistema de gestión de tickets. Administración de cambios Use Azure Logic Apps para aprobar de manera automática los cambios de bajo riesgo o corregir automáticamente ciertos incidentes. Conformidad Use Azure Policy para aplicar y supervisar el cumplimiento de la nube. Seguridad Use Microsoft Defender for Cloud y Microsoft Sentinel para automatizar la detección y respuesta de amenazas de seguridad. Use la gobernanza de identificadores de Entra de Microsoft para revisar los permisos y automatizar la administración de permisos.
Mejora de las operaciones
Optimice el entorno de nube de Azure mediante la promoción de la mejora continua. Evalúe periódicamente las operaciones y priorice el aprendizaje y los comentarios continuos. Siga estos pasos:
Revise las operaciones para mejorar. Siga los procedimientos recomendados para supervisar el mantenimiento, el cumplimiento, la seguridad, los costes, los datos y los recursos en la nube. Realice revisiones operativas semanales para analizar las métricas clave, los incidentes recientes, los cambios implementados y los riesgos previstos. Aborde activamente la proliferación de recursos y la deuda técnica.
Entrenar para operaciones. Fomentar el desarrollo continuo de aptitudes mediante la priorización de recursos de aprendizaje esenciales. Mantener operaciones dinámicas en la nube a través de entornos prácticos de entrenamiento. En la tabla siguiente se proporcionan recursos para el entrenamiento de operaciones.
Entrenamiento de operaciones Descripción Obtener credenciales Establezca objetivos para las credenciales de Microsoft, como habilidades aplicadas y certificaciones de Microsoft para desarrollar experiencia. Uso de recursos operativos Consulte Recursos de Administración de Azure. Uso de la documentación del producto Use Microsoft Learn para encontrar guías sobre servicios de Azure. Adquiere experiencia práctica Fomente prácticas en entornos de espacio aislado que no sean de producción.
Recursos de administración de Azure
Categoría | Recurso de gestión | Descripción |
---|---|---|
Conformidad | Gobernanza de CAF | Marco de gobernanza en la nube de Microsoft |
Seguridad | Administrar operaciones de seguridad | Guía para administrar las operaciones de seguridad |
Seguridad | Herramienta de seguridad de Microsoft | Lista de herramientas de seguridad de Microsoft y Azure |
Seguridad | Seguridad de carga de trabajo | Guía de carga de trabajo para la seguridad |
Administración de recursos | Estrategia de nomenclatura y etiquetado | Recomendaciones de nomenclatura y etiquetado para administrar recursos |
Administración de recursos | abreviatura de Azure | Lista de abreviaturas para recursos de Azure |
Administración de recursos | Azure Advisor | Asistente digital para alinearse con los procedimientos recomendados de Azure. |
Administración de recursos | reglas de nomenclatura de Azure | Reglas de nomenclatura para todos los recursos de Azure |
Administración de recursos | guías de servicio de Azure | Guía para las decisiones de configuración del servicio |
Desarrollo | Desarrollo de software de carga de trabajo | Guía de carga de trabajo para el desarrollo de software |
Desarrollo | Centro de arquitectura de Azure | Arquitecturas y guías para diferentes casos de uso |
Desarrollo | centro de recursos para desarrolladores | Un centro para herramientas y recursos para desarrolladores |
Despliegue | Plantillas de Bicep, Terraform y ARM | Plantillas de IaC para cada recurso de Azure |
Despliegue | Pares de regiones de Azure | Lista de regiones emparejadas de Azure |
Despliegue | Directorio de Azure Cloud Services | Directorio de todos los servicios de Azure |
Despliegue | Implementación de cargas de trabajo | Guía de carga de trabajo para la integración continua |
Monitorización | Supervisión del patrimonio de la nube de Azure | Guía completa de supervisión de Azure |
Monitorización | Supervisión de cargas de trabajo | Guía de carga de trabajo para la supervisión |
Costos | Administración de costos | Guía de administración de costos |
Costos | Optimización de costos de la carga de trabajo | Guía de carga de trabajo para la optimización de costos |
Fiabilidad | Gestión de la confiabilidad de los datos | Guía para mantener la confiabilidad de los datos |
Fiabilidad | Administración de la confiabilidad de los recursos en la nube | Guía para mantener la confiabilidad de los recursos |
Fiabilidad | Administrar incidentes de seguridad | Recomendaciones para responder a incidentes de seguridad |
Rendimiento | eficiencia del rendimiento de la carga de trabajo | Guía de carga de trabajo para la eficiencia del rendimiento |