Compartir a través de


Consideraciones de operaciones para cargas de trabajo de Azure VMware Solution

En este artículo se describe el área de diseño de operaciones para Azure VMware Solution. El objetivo de este artículo es crear un modelo operativo para Azure VMware Solution y las aplicaciones dentro del centro de datos definido por software (SDDC) de VMware. Los procedimientos operativos estándar (SOP) son procesos documentados para administrar una carga de trabajo. Cada carga de trabajo de Azure VMware Solution debe tener SOP para controlar las operaciones. Para mantenerse alineado con los objetivos empresariales y ayudar a evitar el desfase de los procedimientos recomendados, use los SOP en un ciclo continuo de evaluaciones y comprobaciones de estado que se ejecutan en la carga de trabajo de Azure VMware Solution.

Seguimiento de las dependencias de la aplicación

Impacto: Excelencia operativa

Los equipos de TI buscan continuamente optimizar la implementación, la administración y el mantenimiento de aplicaciones, sitios y servicios. Esta práctica ayuda a garantizar un alto rendimiento, confiabilidad, escalabilidad y seguridad. La optimización implica comprender cómo fluyen las aplicaciones dentro de la plataforma Azure VMware Solution. También implica examinar las dependencias externas y las relaciones que están fuera de la nube privada. Un mapa de dependencias es una herramienta valiosa para desarrolladores, arquitectos de aplicaciones y equipos de TI a medida que buscan comprender la estructura y el comportamiento de las aplicaciones. Tener información sobre los componentes de la aplicación, como el software y la infraestructura, los servicios y las dependencias externas, proporciona una manera visual de comprender los flujos de datos, la funcionalidad y las llamadas API.

Recomendaciones
  • Use Application Insights para realizar un seguimiento de las dependencias, como bases de datos, llamadas API y servicios externos.
  • Use la característica service map de Azure Monitor para detectar y visualizar automáticamente distintos componentes de la aplicación y la infraestructura.
  • Use herramientas de terceros como New Relic y Datadog para detectar y asignar dependencias.
  • Use scripts personalizados o herramientas de administración de configuración de terceros que realicen un seguimiento de la automatización y la implementación de dependencias.

Uso de la automatización, los sistemas de control de versiones y las implementaciones azul-verde

Impacto: Excelencia operativa

Las organizaciones pueden reducir el tiempo de comercialización y beneficiarse de una mejor colaboración y calidad de software mediante la adopción de prácticas de DevOps. Por ejemplo, la automatización puede acelerar la implementación y el mantenimiento de las aplicaciones.

Al usar la infraestructura como código (IaC) para organizar las implementaciones de infraestructura, puede beneficiarse de una mayor eficacia en el aprovisionamiento de la infraestructura. IaC también puede facilitar la adopción de principios de DevOps en la administración de la infraestructura.

  • Puede usar IaC para crear varios recursos en Azure VMware Solution. Algunos ejemplos son la nube privada completa o componentes individuales, como clústeres, dispositivos de red y almacenamiento. Herramientas como Azure Resource Manager, Bicep, Terraform, la CLI de Azure y PowerShell automatizan el aprovisionamiento y la configuración de recursos en Azure VMware Solution.
  • Al usar IaC, puede actualizar la infraestructura modificando el código. Este enfoque reduce el tiempo y el esfuerzo necesarios para la configuración y el aprovisionamiento manuales.
  • La salida que se devuelve de la implementación de IaC puede servir como documentación para ayudar a mantener y proporcionar visibilidad adicional sobre el estado y la configuración de los recursos aprovisionados.

Los sistemas de control de versiones proporcionan una manera de administrar el código y usar el control de versiones para realizar un seguimiento y revertir los cambios según sea necesario.

Si necesita actualizar el código de la aplicación entre servidores, las implementaciones azul-verde pueden resultar útiles de muchas maneras:

  • Ayudan a administrar el ciclo de vida de una aplicación de desarrollo a producción.
  • Ayudan a ofrecer a los clientes una experiencia web coherente cuando se aplican actualizaciones y revisiones.
  • Usan algoritmos ponderados para distribuir el tráfico solo a servidores en buen estado durante el mantenimiento.

Azure VMware Solution no ofrece métodos que ofrece una aplicación nativa de nube para lograr implementaciones azul-verde. Sin embargo, estas implementaciones siguen siendo posibles en Azure VMware Solution:

  • Antes de realizar cambios en la configuración de la aplicación, tome instantáneas de su entorno.
  • Use el control de versiones para asegurarse de que puede volver a un estado correcto conocido por última vez.
  • Considere la posibilidad de crear un entorno de ensayo que refleje la producción e implemente actualizaciones antes de iniciarse.
  • Desde el entorno de ensayo, realice actualizaciones graduales en un subconjunto de servidores y pruebe la aplicación.

Puede reducir el esfuerzo manual, minimizar los errores y mejorar el uso de recursos mediante la automatización de tareas rutinarias como el aprovisionamiento, el escalado y la aplicación de revisiones. Las metodologías de DevOps son un elemento importante de una solución bien diseñada para simplificar las operaciones, ahorrar tiempo y ayudar a los equipos a centrarse en actividades de valor añadido.

Recomendaciones
  • Use IaC para implementar y aprovisionar la infraestructura de forma repetible, auditable y coherente.
  • Automatice la expansión y contracción mediante IaC.
  • Use sistemas de control de versiones para realizar un seguimiento de los cambios, colaborar y revertir el código a versiones anteriores según sea necesario.
  • Aproveche el concepto azul-verde mediante la creación de un entorno de ensayo que refleje los entornos de producción y prueba antes de pasar a vivir.
  • Mantenga el último buen estado de la aplicación mediante instantáneas, clonación de discos y código controlado por versiones.

Definición de roles y procesos

Impacto: Excelencia operativa

Los roles y responsabilidades bien definidos ayudan a garantizar la claridad, la responsabilidad y la administración eficaz de una carga de trabajo de Azure VMware Solution bien diseñada. Tener un conjunto definido de estándares y procesos estructurados y saber quién los ejecuta conduce a operaciones eficientes y ayuda a las organizaciones de TI a alinear sus ofertas técnicas con objetivos y estrategias empresariales. A medida que el entorno de Azure VMware Solution crece y evoluciona, los roles y responsabilidades bien definidos conducen a una delegación de tareas más sencilla y a la posibilidad de escalar la solución sin interrupciones. El resultado es una mejor experiencia para los usuarios de la aplicación.

Es importante tener una cultura de mejora continua que se centre en operaciones diarias eficaces para las aplicaciones en la nube privada. Algunos ejemplos de operaciones incluyen mantener acuerdos de nivel de servicio (SLA), mantener la disponibilidad, tener la capacidad para minimizar las interrupciones del servicio y tener una entrega sin problemas. Por ejemplo, Azure VMware Solution permite expandir un entorno con una entrada mínima del usuario. Si expande manualmente el contrato, debe documentar quién realiza las actividades asociadas y cómo llevarlas a cabo. Azure VMware Solution operadores deben asegurarse de que la reserva de nodos está disponible para expandir el entorno según sea necesario. Por ejemplo, designe personas responsables de identificar recursos infrautilizados o inactivos. Proporcione a esas personas un proceso para cambiar el tamaño correcto de las máquinas virtuales (VM) con el fin de reducir los costos innecesarios.

Los equipos de aplicaciones y los desarrolladores deben definir directrices de codificación para la estructura de código, las excepciones y el control de errores. También debe tener métodos para realizar un seguimiento de los cambios, como las revisiones de código normales, la documentación de la API y la refactorización de código normal. Al usar el control de versiones, aplique procedimientos recomendados como la bifurcación, los mensajes de confirmación y los flujos de trabajo de aprobación. Estas prácticas pueden ayudar a que el código sea coherente, fácil de depurar y mantener.

Recomendaciones
  • Trabaje con el equipo de centro de excelencia en la nube (CCoE) para comprender los estándares y las directrices de cumplimiento, seguridad, arquitectura de aplicaciones y procesos operativos.
  • Tenga un equipo de seguridad y cumplimiento centrado en las directivas de seguridad específicas de Azure VMware Solution. Además, haga que el equipo realice evaluaciones de riesgos y garantice el cumplimiento de los requisitos normativos.
  • Adopte un marco como la Biblioteca de infraestructura de tecnología de la información (ITIL). O bien, use prácticas de la Organización Internacional de Normalización (ISO) para asignar operaciones diarias, procesos y actividades. Estas prácticas pueden dar lugar a transferencias de conocimiento más rápidas, mejoras continuas y administración de cambios mejorada.
  • Defina estándares de codificación e implemente prácticas de seguridad durante el desarrollo de aplicaciones.

Uso de estrategias de etiquetado y procedimientos recomendados

Impacto: Excelencia operativa

Puede usar una estrategia de etiquetado para el contracargo y el seguimiento de recursos. Las etiquetas son valores de par de claves que se definen en el nivel de recurso y se aplican durante el aprovisionamiento. Puede usar IaC para crear, actualizar y destruir máquinas virtuales invitadas. Las etiquetas y IaC funcionan junto con las herramientas de administración de configuración. Puede usar etiquetas en las siguientes áreas:

  • Entornos. Puede aplicar etiquetas como producción, CONTROL de calidad o pruebas de desarrollo para identificar los recursos.
  • Centros de costos, para realizar un seguimiento de los costos y los gastos de los recursos.
  • Acuerdos de Nivel de Servicio, para priorizar los requisitos del Acuerdo de Nivel de Servicio de los recursos.
  • Ciclos. Puede etiquetar las aplicaciones como activas, archivadas o retiradas.
  • Importancia, mediante el etiquetado de recursos en función de su impacto empresarial y su importancia.

Como parte de la estrategia de gobernanza y cumplimiento, un grupo debe ser responsable de identificar los recursos sin etiquetas. Ese grupo puede combinar la automatización, la auditoría y los procesos para ayudar a identificar y corregir los recursos que no cumplen las directivas de cumplimiento de etiquetado.

Estas consideraciones de etiquetado son generales. Es importante que la estrategia de etiquetado admita la categorización eficaz de recursos, la administración del ciclo de vida de los recursos y los informes dentro de Azure VMware Solution.

Recomendaciones
  • Aplique etiquetas para la administración de recursos mediante una taxonomía organizativa para identificar cargas de trabajo e infraestructura. La taxonomía debe incluir el host, la empresa, el propietario y el entorno.
  • Use las herramientas adecuadas para mantener y aplicar etiquetas mediante programación durante el aprovisionamiento.
  • Use etiquetas que se alineen con las iniciativas de cumplimiento y gobernanza de su organización, como acuerdos de nivel de servicio, directivas de contracargo y prácticas de administración del ciclo de vida.
  • Tener procesos implementados para identificar y solucionar los recursos que no cumplen los requisitos de etiquetado.

Establecimiento de equipos de respuesta a incidentes

Impacto: Excelencia operativa

Para realizar un seguimiento del estado de la carga de trabajo en una nube privada, es esencial supervisar métricas como el uso de CPU, los registros del sistema operativo y las alertas de seguridad. Para garantizar la eficacia del sistema de alertas, debe evaluar varios aspectos operativos clave. En concreto, compruebe que:

  • Todos los componentes críticos se identifican, como bases de datos, dispositivos de red y almacenamiento.
  • Los umbrales se establecen correctamente.
  • Las alertas son específicas y procesables.
  • Las personas adecuadas reciben alertas.
  • No hay una cantidad considerable de ruido y falsos positivos.
  • Se aplican procedimientos de escalación adecuados.

Antes de un incidente o una interrupción, es fundamental establecer un proceso de notificación bien definido para garantizar la comunicación oportuna. La identificación del personal pertinente responsable de la resolución es fundamental. Un equipo de corrección dedicado puede incluir personal de operaciones, propietarios de aplicaciones y expertos de DevOps que poseen la experiencia necesaria para resolver problemas rápidamente. El equipo de operaciones debe ser consciente de las personas adecuadas que impliquen la evaluación de cada problema.

Un equipo de respuesta a incidentes puede coordinar eficazmente las respuestas manteniendo una lista de distribución completa. Esta lista debe incluir las partes interesadas clave de los departamentos críticos para la empresa y los contactos de escalación designados. Las partes interesadas de la empresa deben informarse de cualquier posible impacto en las operaciones resultantes de un incidente. Los contactos de escalación asignados deben ser personas que puedan tomar decisiones o escalar problemas a niveles más altos para obtener orientación.

Revisar periódicamente la lista de distribución es esencial para garantizar su precisión y alineación con los roles y responsabilidades actuales. Las revisiones garantizan que las partes interesadas clave se informen rápidamente sobre eventos significativos que se producen en Azure VMware Solution.

Una solución de administración de servicios de TI (ITSM) puede asignar eventos a tareas. Por ejemplo, un ITSM nativo de Azure podría usar Azure DevOps para administrar tareas. Puede usar Azure Automation para automatizar procesos de TI y Azure Logic Apps para crear flujos de trabajo. El resultado es una solución personalizada para la administración de problemas en Azure VMware Solution.

Recomendaciones
  • Defina los destinatarios adecuados para Azure VMware Solution alertas e incidentes.
  • Defina claramente los contactos de escalación que deben ser accesibles y autorizados para tomar decisiones o escalar problemas.
  • Identifique a las principales partes interesadas o representantes empresariales para garantizar la visibilidad de cualquier posible impacto y proporcionar instrucciones.
  • Tener un equipo de corrección en su lugar que consta de administradores, ingenieros de infraestructura y personal que tienen la experiencia necesaria para solucionar y resolver problemas.
  • Integre alertas con un ITSM como Azure DevOps, JIRA o ServiceNow.

Procedimientos de documento

Impacto: Confiabilidad

Es importante tener un conocimiento claro de la infraestructura de copia de seguridad y recuperación que existe en su entorno. Para configurar una solución de copia de seguridad, primero debe definir destinos de copia de seguridad para la infraestructura. Debe realizar una copia de seguridad de las aplicaciones, las bases de datos y los recursos en Blob Storage o en un almacén de Azure Backup. También debe designar propietarios responsables de realizar copias de seguridad y restaurar la aplicación.

Recomendaciones
  • Documente claramente la infraestructura de copia de seguridad y recuperación.
  • Documente claramente los procedimientos de copia de seguridad y recuperación.

Implementación de soluciones de copia de seguridad y restauración

Impacto: Confiabilidad

La nube privada debe protegerse contra la pérdida de datos, minimizar el tiempo de inactividad y mantener la continuidad de las operaciones cuando hay interrupciones inesperadas o desastres.

Para la continuidad empresarial, debe implementar una protección de datos sólida para ayudar a garantizar la disponibilidad, la integridad y la capacidad de recuperación de las máquinas virtuales y los datos críticos dentro del entorno de Azure VMware Solution. Las herramientas de copia de seguridad deben estar en vigor y también debe confirmar que funcionan. Un principio clave de Azure VMware Solution es proporcionar compatibilidad con la tecnología del proveedor de software independiente (ISV) que se valida con Azure VMware Solution. Comprender los asociados y las opciones que están disponibles para usted es fundamental para el éxito de la copia de seguridad.

Recomendaciones
  • Use soluciones de copia de seguridad compatibles con Microsoft, como Microsoft Azure Backup Server o proveedores de terceros aprobados.

Uso de Azure Site Recovery

Impacto: Confiabilidad

Azure Site Recovery es una solución de recuperación ante desastres diseñada para minimizar el tiempo de inactividad de las máquinas virtuales en un entorno de Azure VMware Solution cuando se produce un desastre. Azure Site Recovery automatiza y organiza la conmutación por error y la conmutación por recuperación. Las pruebas integradas no disruptivas ayudan a garantizar que se cumplan los objetivos de tiempo de recuperación (RTO). Azure Site Recovery simplifica la administración a través de la automatización y ayuda a garantizar tiempos de recuperación rápidos y altamente predecibles.

Recomendaciones
  • En una interrupción regional prolongada, proteja las cargas de trabajo mediante su replicación en una región de Azure alternativa.
  • Configure Azure Site Recovery para enviar copias de seguridad a una región alternativa.

Girar secretos

Impacto: Seguridad

Es más difícil que los atacantes accedan o mal usen datos cifrados si no tienen acceso a las claves de cifrado. Debe almacenar de forma segura las claves, los secretos y los certificados, y debe rotarlos con frecuencia. Entre los pasos completos para proteger y mantener la integridad de los datos se incluyen:

  • Cifrado de datos.
  • Almacenar claves de forma segura.
  • Cifrado de datos en el nivel de aplicación antes de transmitir datos.
Recomendaciones
  • Use Azure Key Vault para almacenar claves de cifrado.

Pasos siguientes

Ahora que ha examinado los procedimientos de administración operativa, consulte cómo integrar una carga de trabajo de Azure VMware Solution con zonas de aterrizaje de Azure.

Use la herramienta de evaluación para evaluar las opciones de diseño.