Perspectiva de Azure Well-Architected Framework sobre Virtual Machines y conjuntos de escalado

Artículo
02/20/2024

Azure Virtual Machines es un tipo de servicio de proceso que puede usar para crear y ejecutar máquinas virtuales (VM) en la plataforma Azure. Ofrece flexibilidad en diferentes SKU, sistemas operativos y configuraciones con varios modelos de facturación.

En este artículo se supone que como arquitecto ha revisado el árbol de decisión de proceso y ha elegido Virtual Machines como servicio de proceso para la carga de trabajo. En las instrucciones de este artículo se proporcionan recomendaciones arquitectónicas que se asignan a los principios de los pilares de Azure Well-Architected Framework.

Importante

Cómo usar esta guía

Cada sección tiene una lista de comprobación de diseño que presenta áreas arquitectónicas de preocupación junto con estrategias de diseño localizadas en el ámbito de la tecnología.

También se incluyen recomendaciones sobre las funcionalidades tecnológicas que pueden ayudar a materializar esas estrategias. Las recomendaciones no representan una lista exhaustiva de todas las configuraciones disponibles para Virtual Machines y sus dependencias. En su lugar, enumeran las recomendaciones clave asignadas a las perspectivas de diseño. Use las recomendaciones para crear la prueba de concepto o optimizar los entornos existentes.

Arquitectura fundamental que muestra las recomendaciones clave: Virtual Machines arquitectura de línea base.

Ámbito de la tecnología

Esta revisión se centra en las decisiones interrelacionadas para los siguientes recursos de Azure:

Virtual Machines
Conjuntos de escalado de máquinas virtuales de Azure
Discos

Los discos son una dependencia crítica para las arquitecturas basadas en máquinas virtuales. Para obtener más información, consulte Discos y optimización.

Confiabilidad

El propósito del pilar Confiabilidad es proporcionar funcionalidad continua mediante la creación de suficiente resistencia y la capacidad de recuperarse rápidamente de los errores.

Los principios de diseño de confiabilidad proporcionan una estrategia de diseño de alto nivel aplicada para componentes individuales, flujos del sistema y el sistema en su conjunto.

Diseño de una lista de comprobación

Inicie la estrategia de diseño en función de la lista de comprobación de revisión de diseño para confiabilidad. Determine su relevancia para los requisitos empresariales, teniendo en cuenta las SKU y las características de las máquinas virtuales y sus dependencias. Amplíe la estrategia para incluir más enfoques según sea necesario.

Revise Virtual Machines cuotas y límites que podrían suponer restricciones de diseño. Las máquinas virtuales tienen límites y cuotas específicos, que varían en función del tipo de máquina virtual o de la región. Puede haber restricciones de suscripción, como el número de máquinas virtuales por suscripción o el número de núcleos por máquina virtual. Si otras cargas de trabajo comparten la suscripción, es posible que se reduzca la capacidad de consumir datos. Compruebe los límites de las máquinas virtuales, los conjuntos de escalado de máquinas virtuales y los discos administrados.
Realice un análisis del modo de error para minimizar los puntos de error mediante el análisis de interacciones de máquina virtual con los componentes de red y almacenamiento. Elija configuraciones como discos del sistema operativo (SO) efímeros para localizar el acceso al disco y evitar saltos de red. Agregue un equilibrador de carga para mejorar la autoconservación mediante la distribución del tráfico de red entre varias máquinas virtuales, lo que mejora la disponibilidad y la confiabilidad.
Calcule los objetivos de nivel de servicio (SLO) compuestos en función de los acuerdos de nivel de servicio (SLA) de Azure. Asegúrese de que el SLO no sea mayor que los SLA de Azure para evitar expectativas poco realistas y posibles problemas.

Tenga en cuenta las complejidades que presentan las dependencias. Por ejemplo, algunas dependencias, como redes virtuales y tarjetas de interfaz de red (NIC), no tienen sus propios SLA. Otras dependencias, como un disco de datos asociado, tienen acuerdos de nivel de servicio que se integran con acuerdos de nivel de servicio de máquina virtual. Debe tener en cuenta estas variaciones porque pueden afectar al rendimiento y la confiabilidad de las máquinas virtuales.

Tenga en cuenta las dependencias críticas de las máquinas virtuales en componentes como discos y componentes de red. Si entiende estas relaciones, puede determinar los flujos críticos que afectan a la confiabilidad.
Crear aislamiento de estado. Los datos de carga de trabajo deben estar en un disco de datos independiente para evitar la interferencia con el disco del sistema operativo. Si se produce un error en una máquina virtual, puede crear un nuevo disco del sistema operativo con el mismo disco de datos, lo que garantiza la resistencia y el aislamiento de errores. Para más información, consulte Discos de sistema operativo efímeros.
Hacer que las máquinas virtuales y sus dependencias sean redundantes entre zonas. Si se produce un error en una máquina virtual, la carga de trabajo debe seguir funcionando debido a la redundancia. Incluya dependencias en las opciones de redundancia. Por ejemplo, use las opciones de redundancia integradas que están disponibles con discos. Use direcciones IP con redundancia de zona para garantizar la disponibilidad de datos y el tiempo de actividad elevado.
Prepárese para escalar y escalar horizontalmente para evitar la degradación del nivel de servicio y evitar errores. Virtual Machine Scale Sets tienen funcionalidades de escalado automático que crean nuevas instancias según sea necesario y distribuyen la carga entre varias máquinas virtuales y zonas de disponibilidad.
Explore las opciones de recuperación automática. Azure admite la supervisión de la degradación del estado y las características de recuperación automática para las máquinas virtuales. Por ejemplo, los conjuntos de escalado proporcionan reparaciones automáticas de instancias. En escenarios más avanzados, la recuperación automática implica el uso de Azure Site Recovery, tener un modo de espera pasivo para conmutar por error o volver a implementar desde la infraestructura como código (IaC). El método que elija debe alinearse con los requisitos empresariales y las operaciones de la organización. Para más información, consulte Interrupciones del servicio de máquina virtual.
Rightsize las máquinas virtuales y sus dependencias. Comprenda el trabajo esperado de la máquina virtual para asegurarse de que no está infradimensionado y puede controlar la carga máxima. Tener capacidad adicional para mitigar los errores.
Cree un plan de recuperación ante desastres completo. La preparación ante desastres implica crear un plan completo y decidir una tecnología para la recuperación.

Las dependencias y los componentes con estado, como el almacenamiento conectado, pueden complicar la recuperación. Si los discos están inactivos, ese error afecta al funcionamiento de la máquina virtual. Incluya un proceso claro para estas dependencias en los planes de recuperación.
Ejecutar operaciones con rigor. Las opciones de diseño de confiabilidad deben ser compatibles con operaciones eficaces basadas en los principios de supervisión, pruebas de resistencia en producción, revisiones y actualizaciones automatizadas de máquinas virtuales de aplicaciones y coherencia de las implementaciones. Para obtener instrucciones operativas, consulte Excelencia operativa.

Recomendaciones

Recomendación	Prestación
(Conjunto de escalado) Use Virtual Machine Scale Sets en modo de orquestación flexible para implementar máquinas virtuales.	La aplicación a prueba de futuro para escalar y aprovechar las ventajas de las garantías de alta disponibilidad que distribuyen las máquinas virtuales entre dominios de error en una región o una zona de disponibilidad.
(MÁQUINAS VIRTUALES) Implemente puntos de conexión de heath que emiten estados de estado de la instancia en máquinas virtuales. (Conjunto de escalado) Habilite las reparaciones automáticas en el conjunto de escalado especificando la acción de reparación preferida. Considere la posibilidad de establecer un período de tiempo durante el cual las reparaciones automáticas se pausan si cambia el estado de la máquina virtual.	Mantenga la disponibilidad incluso si una instancia se considera incorrecta. Las reparaciones automáticas inician la recuperación reemplazando la instancia defectuosa. Establecer un período de tiempo puede evitar operaciones de reparación involuntarias o prematuras.
(Conjunto de escalado) Habilite el sobreaprovisionamiento en conjuntos de escalado.	El aprovisionamiento excesivo reduce los tiempos de implementación y tiene una ventaja de costo porque no se facturan las máquinas virtuales adicionales.
(Conjunto de escalado) Permitir la orquestación flexible para distribuir las instancias de máquina virtual en tantos dominios de error como sea posible.	Esta opción aísla los dominios de error. Durante los períodos de mantenimiento, cuando se actualiza un dominio de error, las instancias de máquina virtual están disponibles en los otros dominios de error.
(Conjunto de escalado) Implementar entre zonas de disponibilidad en conjuntos de escalado. Configure al menos dos instancias en cada zona. El equilibrio de zona distribuye igualmente las instancias entre zonas.	Las instancias de máquina virtual se aprovisionan en ubicaciones físicamente independientes dentro de cada región de Azure que son tolerantes a errores locales. Tenga en cuenta que, en función de la disponibilidad de los recursos, puede haber un número desigual de instancias entre zonas. El equilibrio de zona admite la disponibilidad asegurándose de que, si una zona está inactiva, las demás tienen instancias suficientes. Dos instancias de cada zona proporcionan un búfer durante las actualizaciones.
(MÁQUINAS VIRTUALES) Aproveche la característica de reservas de capacidad.	La capacidad está reservada para su uso y está disponible dentro del ámbito de los Acuerdos de Nivel de Servicio aplicables. Puede eliminar las reservas de capacidad cuando ya no las necesite y la facturación se basa en el consumo.

Sugerencia

Para más información sobre la confiabilidad de las máquinas virtuales, consulte Confiabilidad en Virtual Machines.

Seguridad

El propósito del pilar seguridad es proporcionar garantías de confidencialidad, integridad y disponibilidad a la carga de trabajo.

Los principios de diseño de seguridad proporcionan una estrategia de diseño de alto nivel para lograr esos objetivos mediante la aplicación de enfoques al diseño técnico de Virtual Machines.

Diseño de una lista de comprobación

Inicie la estrategia de diseño en función de la lista de comprobación de revisión de diseño para seguridad. Identificar vulnerabilidades y controles para mejorar la posición de seguridad. Amplíe la estrategia para incluir más enfoques según sea necesario.

Revise las líneas base de seguridad para máquinas virtuales Linux y Windows y Virtual Machine Scale Sets.

Como parte de las opciones de tecnología de línea base, tenga en cuenta las características de seguridad de las SKU de máquina virtual que admiten la carga de trabajo.
Asegúrese de aplicar revisiones y actualizaciones de seguridad oportunas y automatizadas. Asegúrese de que las actualizaciones se implementen y validen automáticamente mediante un proceso bien definido. Use una solución como Azure Automation para administrar las actualizaciones del sistema operativo y mantener el cumplimiento de seguridad mediante la realización de actualizaciones críticas.
Identifique las máquinas virtuales que contienen el estado. Asegúrese de que los datos se clasifican según las etiquetas de confidencialidad proporcionadas por la organización. Proteja los datos mediante controles de seguridad como los niveles adecuados de cifrado en reposo y en tránsito. Si tiene requisitos de alta confidencialidad, considere la posibilidad de usar controles de alta seguridad, como el cifrado doble y la computación confidencial de Azure para proteger los datos en uso.
Proporcione segmentación a las máquinas virtuales y los conjuntos de escalado estableciendo límites de red y controles de acceso. Coloque máquinas virtuales en grupos de recursos que compartan el mismo ciclo de vida.
Aplique controles de acceso a las identidades que intentan llegar a las máquinas virtuales y también a las máquinas virtuales que lleguen a otros recursos. Use Microsoft Entra ID para las necesidades de autenticación y autorización. Coloque contraseñas seguras, autenticación multifactor y control de acceso basado en rol (RBAC) en su lugar para las máquinas virtuales y sus dependencias, como secretos, para permitir que las identidades permitidas realicen solo las operaciones que se esperan de sus roles.

Restrinja el acceso a los recursos en función de las condiciones mediante Microsoft Entra acceso condicional. Defina las directivas condicionales en función de la duración y el conjunto mínimo de permisos necesarios.
Use controles de red para restringir el tráfico de entrada y salida. Aísle las máquinas virtuales y los conjuntos de escalado en Azure Virtual Network y defina los grupos de seguridad de red para filtrar el tráfico. Protección contra ataques de denegación de servicio distribuido (DDoS). Use equilibradores de carga y reglas de firewall para protegerse frente a ataques de filtración de datos y tráfico malintencionado.

Use Azure Bastion para proporcionar conectividad segura a las máquinas virtuales para el acceso operativo.

La comunicación hacia y desde las máquinas virtuales a las soluciones de plataforma como servicio (PaaS) debe ser a través de puntos de conexión privados.
Reduzca la superficie expuesta a ataques mediante la protección de imágenes del sistema operativo y la eliminación de componentes sin usar. Use imágenes más pequeñas y quite archivos binarios que no son necesarios para ejecutar la carga de trabajo. Apriete las configuraciones de máquina virtual quitando características, como cuentas y puertos predeterminados, que no es necesario.
Proteja secretos como los certificados que necesita para proteger los datos en tránsito. Considere la posibilidad de usar la extensión de Azure Key Vault para Windows o Linux que actualice automáticamente los certificados almacenados en un almacén de claves. Cuando detecta un cambio en los certificados, la extensión recupera e instala los certificados correspondientes.
Detección de amenazas. Supervise las máquinas virtuales en busca de amenazas y configuraciones incorrectas. Use Defender para servidores para capturar cambios en la máquina virtual y el sistema operativo y mantener una pista de auditoría de acceso, nuevas cuentas y cambios en los permisos.
Prevención de amenazas. Proteja contra ataques de malware y actores malintencionados mediante la implementación de controles de seguridad como firewalls, software antivirus y sistemas de detección de intrusiones. Determine si se requiere un entorno de ejecución de confianza (TEE).

Recomendaciones

Recomendación	Prestación
(Conjunto de escalado) Asigne una identidad administrada a conjuntos de escalado. Todas las máquinas virtuales del conjunto de escalado obtienen la misma identidad a través del perfil de máquina virtual especificado. (MÁQUINAS VIRTUALES) También puede asignar una identidad administrada a máquinas virtuales individuales al crearlas y, a continuación, agregarla a un conjunto de escalado si es necesario.	Cuando las máquinas virtuales se comunican con otros recursos, cruzan un límite de confianza. Los conjuntos de escalado y las máquinas virtuales deben autenticar su identidad antes de permitir la comunicación. Microsoft Entra ID controla esa autenticación mediante identidades administradas.
(Conjunto de escalado) Elija SKU de máquina virtual con características de seguridad. Por ejemplo, algunas SKU admiten el cifrado de BitLocker y la computación confidencial proporciona cifrado de datos en uso. Revise las características para comprender las limitaciones.	Las características proporcionadas por Azure se basan en señales que se capturan en muchos inquilinos y pueden proteger los recursos mejor que los controles personalizados. También puede usar directivas para aplicar esos controles.
(Máquinas virtuales, conjunto de escalado) Aplique etiquetas recomendadas por la organización en los recursos aprovisionados.	El etiquetado es una manera común de segmentar y organizar los recursos y puede ser crucial durante la administración de incidentes. Para obtener más información, vea Propósito de nomenclatura y etiquetado.
(Máquinas virtuales, conjunto de escalado) Establezca un perfil de seguridad con las características de seguridad que desea habilitar en la configuración de la máquina virtual. Por ejemplo, al especificar el cifrado en el host del perfil, los datos almacenados en el host de máquina virtual se cifran en reposo y los flujos se cifran en el servicio de almacenamiento.	Las características del perfil de seguridad se habilitan automáticamente cuando se crea la máquina virtual. Para más información, consulte Línea base de seguridad de Azure para Virtual Machine Scale Sets.
(MÁQUINAS VIRTUALES) Elija opciones de red seguras para el perfil de red de la máquina virtual. No asocie directamente direcciones IP públicas a las máquinas virtuales y no habilite el reenvío IP. Asegúrese de que todas las interfaces de red virtual tengan un grupo de seguridad de red asociado.	Puede establecer controles de segmentación en el perfil de red. Los atacantes examinan las direcciones IP públicas, lo que hace que las máquinas virtuales sean vulnerables a las amenazas.
(MÁQUINAS VIRTUALES) Elija opciones de almacenamiento seguro para el perfil de almacenamiento de la máquina virtual. Habilite el cifrado de disco y el cifrado de datos en reposo de forma predeterminada. Deshabilite el acceso de red pública a los discos de máquina virtual.	Deshabilitar el acceso a la red pública ayuda a evitar el acceso no autorizado a los datos y recursos.
(Máquinas virtuales, conjunto de escalado) Incluya extensiones en las máquinas virtuales que protegen contra amenazas. Por ejemplo, - Key Vault extensión para Windows y Linux - autenticación de Microsoft Entra ID - Microsoft Antimalware de Azure Cloud Services y Virtual Machines - Extensión de Azure Disk Encryption para Windows y Linux.	Las extensiones se usan para arrancar las máquinas virtuales con el software adecuado que protege el acceso a las máquinas virtuales y desde ellas. Las extensiones proporcionadas por Microsoft se actualizan con frecuencia para mantenerse al día con los estándares de seguridad en constante evolución.

Optimización de costos

La optimización de costos se centra en detectar patrones de gasto, priorizar las inversiones en áreas críticas y optimizar en otros usuarios para satisfacer el presupuesto de la organización a la vez que cumple los requisitos empresariales.

Los principios de diseño de optimización de costos proporcionan una estrategia de diseño de alto nivel para lograr esos objetivos y hacer inconvenientes según sea necesario en el diseño técnico relacionado con Virtual Machines y su entorno.

Diseño de una lista de comprobación

Inicie su estrategia de diseño en función de la lista de comprobación de revisión de diseño para la optimización de costos para inversiones. Ajuste el diseño para que la carga de trabajo esté alineada con el presupuesto asignado para la carga de trabajo. El diseño debe usar las funcionalidades adecuadas de Azure, supervisar las inversiones y encontrar oportunidades para optimizar con el tiempo.

Calcule los costos realistas. Use la calculadora de precios para calcular los costos de las máquinas virtuales. Identifique la mejor máquina virtual para la carga de trabajo mediante el selector de máquinas virtuales. Para más información, consulte Precios de Linux y Windows .
Implementar límites de protección de costos. Use directivas de gobernanza para restringir los tipos de recursos, las configuraciones y las ubicaciones. Use RBAC para bloquear acciones que pueden dar lugar a un exceso de tiempo.
Elija los recursos adecuados. La selección de tamaños y SKU del plan de máquina virtual afecta directamente al costo general. Elija máquinas virtuales en función de las características de la carga de trabajo. ¿La CPU de la carga de trabajo consume muchos recursos o ejecuta procesos interrumpibles? Cada SKU tiene opciones de disco asociadas que afectan al costo total.
Elija las funcionalidades adecuadas para los recursos dependientes. Ahorre en los costos de almacenamiento de copia de seguridad del nivel estándar del almacén mediante Azure Backup almacenamiento con capacidad reservada. Ofrece un descuento al confirmar una reserva durante un año o tres años.

El nivel de archivo de Azure Storage es un nivel sin conexión optimizado para almacenar datos de blobs a los que rara vez se accede. El nivel de archivo ofrece los costos de almacenamiento más bajos, pero mayores costos de recuperación de datos y latencia en comparación con los niveles en línea de acceso frecuente y esporádico.

Considere la posibilidad de usar la recuperación ante desastres de zona a zona para que las máquinas virtuales se recuperen del error del sitio, a la vez que se reduce la complejidad de la disponibilidad mediante servicios con redundancia de zona. Puede haber beneficios de costos de una complejidad operativa reducida.
Elija el modelo de facturación adecuado. Evalúe si los modelos basados en el compromiso para calcular optimizan los costos en función de los requisitos empresariales de la carga de trabajo. Tenga en cuenta estas opciones de Azure:
- Reservas de Azure: pago por adelantado de cargas de trabajo predecibles para reducir los costos en comparación con los precios basados en el consumo.
  
  Importante
  
  Compre instancias reservadas para reducir los costos de Azure de las cargas de trabajo que tienen un uso estable. Administre el uso para asegurarse de que no paga por más recursos de los que usa. Mantenga las instancias reservadas sencillas y mantenga baja la sobrecarga de administración para reducir los costos.
- Plan de ahorro: si se compromete a gastar una cantidad fija por hora en los servicios de proceso durante uno o tres años, este plan puede reducir los costos.
- Ventaja híbrida de Azure: guarde al migrar las máquinas virtuales locales a Azure.
Supervisar el uso. Supervise continuamente los patrones de uso y detecte máquinas virtuales no utilizada o infrautilizadas. En esas instancias, apague las instancias de máquina virtual cuando no estén en uso. La supervisión es un enfoque clave de excelencia operativa. Para obtener más información, consulte las recomendaciones de Excelencia operativa.
Busque formas de optimizar. Algunas estrategias incluyen elegir el enfoque más rentable entre aumentar los recursos de un sistema existente o escalar verticalmente y agregar más instancias de ese sistema o escalar horizontalmente. Puede descargar la demanda distribuyéndola a otros recursos, o puede reducir la demanda implementando colas de prioridad, descarga de puerta de enlace, almacenamiento en búfer y limitación de velocidad. Para obtener más información, consulte las recomendaciones de Eficiencia del rendimiento.

Recomendaciones

Recomendación	Prestación
(Máquinas virtuales, conjunto de escalado) Elija el tamaño adecuado del plan de máquina virtual y la SKU. Identifique los mejores tamaños de máquina virtual para la carga de trabajo. Use el selector de máquinas virtuales para identificar la mejor máquina virtual para la carga de trabajo. Consulte Precios de Windows y Linux . Para cargas de trabajo como trabajos de procesamiento por lotes muy paralelos que pueden tolerar algunas interrupciones, considere la posibilidad de usar Azure Spot Virtual Machines. Las máquinas virtuales de acceso puntual son adecuadas para experimentar, desarrollar y probar soluciones a gran escala.	Las SKU tienen un precio según las funcionalidades que ofrecen. Si no necesita funcionalidades avanzadas, no se superpone a las SKU. Las máquinas virtuales de acceso puntual aprovechan la capacidad sobrante en Azure a un costo menor.
(Máquinas virtuales, conjunto de escalado) Evalúe las opciones de disco asociadas a las SKU de la máquina virtual. Determine sus necesidades de rendimiento teniendo en cuenta las necesidades de capacidad de almacenamiento y tenga en cuenta los patrones de carga de trabajo fluctuantes. Por ejemplo, el disco SSD Premium v2 de Azure permite ajustar de forma granular el rendimiento independientemente del tamaño del disco.	Algunos tipos de disco de alto rendimiento ofrecen características y estrategias de optimización de costos adicionales. La funcionalidad de ajuste del disco SSD v2 Premium puede reducir los costos porque proporciona un alto rendimiento sin aprovisionamiento excesivo, lo que podría provocar recursos infrautilizados.
(Conjunto de escalado) Combine máquinas virtuales normales con máquinas virtuales de acceso puntual. La orquestación flexible permite distribuir máquinas virtuales de acceso puntual en función de un porcentaje especificado.	Reduzca los costos de infraestructura de proceso aplicando los descuentos profundos de las máquinas virtuales de acceso puntual.
(Conjunto de escalado) Reduzca el número de instancias de máquina virtual cuando disminuya la demanda. Establezca una directiva de reducción horizontal basada en criterios. Detenga las máquinas virtuales durante las horas fuera del horario laboral. Puede usar la característica start/stop de Azure Automation y configurarla según sus necesidades empresariales.	El escalado o la detención de recursos cuando no están en uso reduce el número de máquinas virtuales que se ejecutan en el conjunto de escalado, lo que ahorra costos. La característica Start/Stop es una opción de automatización de bajo costo.
(Máquinas virtuales, conjunto de escalado) Aproveche la movilidad de licencias mediante Ventaja híbrida de Azure. Las máquinas virtuales tienen una opción de licencia que le permite traer sus propias licencias locales del sistema operativo Windows Server a Azure. Ventaja híbrida de Azure también le permite traer determinadas suscripciones de Linux a Azure.	Puede maximizar las licencias locales al mismo tiempo que obtiene las ventajas de la nube.

Excelencia operativa

La excelencia operativa se centra principalmente en los procedimientos para las prácticas de desarrollo, la observabilidad y la administración de versiones.

Los principios de diseño de excelencia operativa proporcionan una estrategia de diseño de alto nivel para lograr esos objetivos para los requisitos operativos de la carga de trabajo.

Diseño de una lista de comprobación

Inicie la estrategia de diseño en función de la lista de comprobación de revisión de diseño para la excelencia operativa para definir procesos de observabilidad, pruebas e implementación relacionados con Virtual Machines y conjuntos de escalado.

Supervise las instancias de máquina virtual. Recopile registros y métricas de instancias de máquina virtual para supervisar el uso de recursos y medir el estado de las instancias. Algunas métricas comunes incluyen el uso de CPU, el número de solicitudes y la latencia de entrada y salida (E/S). Configure alertas de Azure Monitor para recibir notificaciones sobre problemas y para detectar cambios de configuración en el entorno.
Supervise el estado de las máquinas virtuales y sus dependencias.
- Implemente componentes de supervisión para recopilar registros y métricas que proporcionan una vista completa de las máquinas virtuales, el sistema operativo invitado y los datos de diagnóstico de arranque. Virtual Machine Scale Sets acumulación de telemetría, lo que permite ver las métricas de mantenimiento en un nivel de máquina virtual individual o como agregado. Use Azure Monitor para ver estos datos por máquina virtual o agregados en varias máquinas virtuales. Para obtener más información, consulte Recomendaciones sobre los agentes de supervisión.
- Aproveche los componentes de red que comprueban el estado de mantenimiento de las máquinas virtuales. Por ejemplo, Azure Load Balancer hace ping a las máquinas virtuales para detectar máquinas virtuales incorrectas y volver a enrutar el tráfico en consecuencia.
- Configure reglas de alertas de Azure Monitor. Determine las condiciones importantes de los datos de supervisión para identificar y solucionar problemas antes de que afecten al sistema.
Cree un plan de mantenimiento que incluya la aplicación de revisiones del sistema normal como parte de las operaciones rutinarias. Incluya procesos de emergencia que permitan una aplicación de revisión inmediata. Puede tener procesos personalizados para administrar la aplicación de revisiones o delegar parcialmente la tarea en Azure. Azure proporciona características para el mantenimiento de máquinas virtuales individuales. Puede configurar ventanas de mantenimiento para minimizar las interrupciones durante las actualizaciones. Durante las actualizaciones de la plataforma, las consideraciones de dominio de error son clave para la resistencia. Se recomienda implementar al menos dos instancias en una zona. Dos máquinas virtuales por zona garantizan un mínimo de una máquina virtual en cada zona porque solo se actualiza un dominio de error en una zona a la vez. Por lo tanto, para tres zonas, aprovisione al menos seis instancias.
Automatice los procesos de arranque, ejecución de scripts y configuración de máquinas virtuales. Puede automatizar procesos mediante extensiones o scripts personalizados. Se recomiendan las siguientes opciones:
- La extensión de máquina virtual Key Vault actualiza automáticamente los certificados almacenados en un almacén de claves.
- La extensión de script personalizado de Azure para Windows y Linux descarga y ejecuta scripts en Virtual Machines. Use esta extensión para la configuración posterior a la implementación, la instalación de software o cualquier otra tarea de configuración o administración.
- Use cloud-init para configurar el entorno de inicio para máquinas virtuales basadas en Linux.
Tener procesos para instalar actualizaciones automáticas. Considere la posibilidad de usar la aplicación automática de revisiones de invitado de máquina virtual para una implementación oportuna de revisiones críticas y revisiones de seguridad. Use Update Management en Azure Automation para administrar las actualizaciones del sistema operativo para las máquinas virtuales Windows y Linux en Azure.
Cree un entorno de prueba que coincida estrechamente con el entorno de producción para probar las actualizaciones y los cambios antes de implementarlos en producción. Tener procesos implementados para probar las actualizaciones de seguridad, las líneas de base de rendimiento y los errores de confiabilidad. Aproveche las bibliotecas de errores de Azure Chaos Studio para insertar y simular condiciones de error. Para más información, consulte Biblioteca de errores y acciones de Azure Chaos Studio.
Administre la cuota. Planee qué nivel de cuota requiere la carga de trabajo y revise ese nivel con regularidad a medida que evoluciona la carga de trabajo. Si necesita aumentar o disminuir la cuota, solicite esos cambios al principio.

Recomendaciones

Recomendación	Prestación
(Conjunto de escalado) Virtual Machine Scale Sets en modo de orquestación flexible puede ayudar a simplificar la implementación y administración de la carga de trabajo. Por ejemplo, puede administrar fácilmente la recuperación automática mediante reparaciones automáticas.	La orquestación flexible puede administrar instancias de máquina virtual a escala. La entrega de máquinas virtuales individuales agrega sobrecarga operativa. Por ejemplo, al eliminar instancias de máquina virtual, los discos asociados y las NIC también se eliminan automáticamente. Las instancias de máquina virtual se distribuyen entre varios dominios de error para que las operaciones de actualización no interrumpan el servicio.
(Conjunto de escalado) Mantenga actualizadas las máquinas virtuales estableciendo una directiva de actualización. Se recomienda actualizar gradualmente. Sin embargo, si necesita un control granular, elija actualizar manualmente. Para la orquestación flexible, puede usar Update Management en Azure Automation.	La seguridad es la razón principal de las actualizaciones. Las garantías de seguridad de las instancias no deben descaer con el tiempo. Las actualizaciones graduales se realizan en lotes, lo que garantiza que todas las instancias no estén inactivas al mismo tiempo.
(Máquinas virtuales, conjunto de escalado) Implemente automáticamente aplicaciones de máquina virtual desde Azure Compute Gallery mediante la definición de las aplicaciones en el perfil.	Las máquinas virtuales del conjunto de escalado se crean y las aplicaciones especificadas están preinstaladas, lo que facilita la administración.
Instale componentes de software precompilados como extensiones como parte del arranque. Azure admite muchas extensiones que se pueden usar para configurar, supervisar, proteger y proporcionar aplicaciones de utilidad para las máquinas virtuales. Habilite las actualizaciones automáticas en las extensiones.	Las extensiones pueden ayudar a simplificar la instalación de software a escala sin tener que instalar, configurar o actualizar manualmente en cada máquina virtual.
(Máquinas virtuales, conjunto de escalado) Supervise y mida el estado de las instancias de máquina virtual. Implemente la extensión monitor agent en las máquinas virtuales para recopilar datos de supervisión del sistema operativo invitado con reglas de recopilación de datos específicas del sistema operativo. Habilite VM Insights para supervisar el estado y el rendimiento y ver las tendencias de los datos recopilados. Use diagnósticos de arranque para obtener información como arranque de las máquinas virtuales. Los diagnósticos de arranque también diagnostican errores de arranque.	Los datos de supervisión están en el núcleo de la resolución de incidentes. Una pila de supervisión completa proporciona información sobre cómo funcionan las máquinas virtuales y su estado. Al supervisar continuamente las instancias, puede estar listo o evitar errores, como problemas de sobrecarga de rendimiento y confiabilidad.

Eficiencia del rendimiento

La eficiencia del rendimiento consiste en mantener la experiencia del usuario incluso cuando hay un aumento de la carga mediante la administración de la capacidad. La estrategia incluye el escalado de recursos, la identificación y optimización de posibles cuellos de botella y la optimización para lograr un rendimiento máximo.

Los principios de diseño de eficiencia del rendimiento proporcionan una estrategia de diseño de alto nivel para lograr esos objetivos de capacidad con respecto al uso esperado.

Diseño de una lista de comprobación

Inicie la estrategia de diseño en función de la lista de comprobación de revisión de diseño para la eficiencia del rendimiento. Defina una línea base basada en indicadores clave de rendimiento para Virtual Machines y conjuntos de escalado.

Defina los objetivos de rendimiento. Identifique las métricas de máquina virtual para realizar un seguimiento de los indicadores de rendimiento como tiempo de respuesta, uso de CPU y uso de memoria, así como métricas de carga de trabajo, como transacciones por segundo, usuarios simultáneos y disponibilidad y estado.
Tenga en cuenta el perfil de rendimiento de las máquinas virtuales, los conjuntos de escalado y la configuración de disco en el planeamiento de la capacidad. Cada SKU tiene un perfil diferente de memoria y CPU y se comporta de forma diferente según el tipo de carga de trabajo. Realice pilotos y pruebas de concepto para comprender el comportamiento del rendimiento en la carga de trabajo específica.
Ajuste del rendimiento de la máquina virtual. Aproveche las ventajas de la optimización del rendimiento y mejore las características según sea necesario para la carga de trabajo. Por ejemplo, use memoria rápida no volátil (NVMe) conectada localmente para casos de uso de alto rendimiento y redes aceleradas, y use SSD Premium v2 para mejorar el rendimiento y la escalabilidad.
Tenga en cuenta los servicios dependientes. Las dependencias de carga de trabajo, como el almacenamiento en caché, el tráfico de red y las redes de entrega de contenido, que interactúan con las máquinas virtuales pueden afectar al rendimiento. Además, considere la posibilidad de distribuir geográficamente, como zonas y regiones, que pueden agregar latencia.
Recopilar datos de rendimiento. Siga los procedimientos recomendados de excelencia operativa para supervisar e implementar las extensiones adecuadas para ver las métricas que realizan un seguimiento de los indicadores de rendimiento.
Grupos con ubicación por proximidad. Use grupos de selección de ubicación de proximidad en cargas de trabajo en las que se requiera una latencia baja para asegurarse de que las máquinas virtuales se encuentran físicamente cerca entre sí.

Recomendaciones

Recomendación	Prestación
(Máquinas virtuales, conjunto de escalado) Elija SKU para máquinas virtuales que se alineen con el planeamiento de capacidad. Tenga una buena comprensión de los requisitos de carga de trabajo, incluido el número de núcleos, memoria, almacenamiento y ancho de banda de red para que pueda filtrar las SKU no adecuadas.	La asignación de derechos a las máquinas virtuales es una decisión fundamental que afecta significativamente al rendimiento de la carga de trabajo. Sin el conjunto adecuado de máquinas virtuales, puede experimentar problemas de rendimiento y acumular costos innecesarios.
(Máquinas virtuales, conjunto de escalado) Implemente máquinas virtuales de carga de trabajo sensibles a la latencia en grupos con ubicación por proximidad.	Los grupos con ubicación por proximidad reducen la distancia física entre los recursos de proceso de Azure, lo que puede mejorar el rendimiento y reducir la latencia de red entre máquinas virtuales independientes, máquinas virtuales en varios conjuntos de disponibilidad o máquinas virtuales en varios conjuntos de escalado.
(Máquinas virtuales, conjunto de escalado) Establezca el perfil de almacenamiento mediante el análisis del rendimiento del disco de las cargas de trabajo existentes y la SKU de máquina virtual. Use discos SSD Premium para máquinas virtuales de producción. Ajuste el rendimiento de los discos con SSD Premium v2. Use dispositivos NVMe conectados localmente.	Los discos SSD Premium ofrecen compatibilidad con discos de alto rendimiento y baja latencia con cargas de trabajo intensivas de E/S. Ssd Premium v2 no requiere el cambio de tamaño de disco, lo que permite un alto rendimiento sin exceso de aprovisionamiento y minimiza el costo de la capacidad sin usar. Cuando está disponible en las SKU de máquina virtual, los dispositivos NVMe conectados localmente o similares pueden ofrecer un alto rendimiento, especialmente para casos de uso que requieren operaciones de entrada/salida altas por segundo (IOPS) y baja latencia.
(MÁQUINAS VIRTUALES) Considere la posibilidad de habilitar las redes aceleradas.	Permite la virtualización de E/S raíz única (SR-IOV) a una máquina virtual, lo que mejora considerablemente su rendimiento de red.
(Máquinas virtuales, conjunto de escalado) Establezca reglas de escalado automático para aumentar o disminuir el número de instancias de máquina virtual en el conjunto de escalado en función de la demanda.	Si aumenta la demanda de la aplicación, la carga de las instancias de máquina virtual del conjunto de escalado aumenta. Las reglas de escalado automático garantizan que tiene suficientes recursos para satisfacer la demanda.

Directivas de Azure

Azure proporciona un amplio conjunto de directivas integradas relacionadas con Virtual Machines y sus dependencias. Algunas de las recomendaciones anteriores se pueden auditar mediante Azure Policy. Por ejemplo, puede comprobar si:

El cifrado en el host está habilitado.
Las extensiones antimalware se implementan y habilitan para actualizaciones automáticas en máquinas virtuales que ejecutan Windows Server.
La aplicación automática de revisiones de imágenes del sistema operativo en conjuntos de escalado está habilitada.
Solo se instalan las extensiones de máquina virtual aprobadas.
El agente de supervisión y los agentes de dependencia están habilitados en las nuevas máquinas virtuales del entorno de Azure.
Solo se implementan las SKU de máquina virtual permitidas para limitar los tamaños según las restricciones de costo.
Los puntos de conexión privados se usan para acceder a los recursos de disco.
La detección de vulnerabilidades está habilitada. Hay reglas especializadas para las máquinas Windows. Por ejemplo, puede programar Windows Defender examinar cada día.

Para una gobernanza completa, revise las definiciones integradas de Azure Policy para Virtual Machines y otras directivas que podrían afectar a la seguridad de la capa de proceso.

Recomendaciones de Azure Advisor

Azure Advisor es un consultor en la nube personalizado que ayuda a seguir los procedimientos recomendados para optimizar las implementaciones de Azure. Estas son algunas recomendaciones que pueden ayudarle a mejorar la confiabilidad, la seguridad, la rentabilidad, el rendimiento y la excelencia operativa de Virtual Machines.

Pasos siguientes

Tenga en cuenta los siguientes artículos como recursos que muestran las recomendaciones resaltadas en este artículo.

Use las siguientes arquitecturas de referencia como ejemplos de cómo puede aplicar las instrucciones de este artículo a una carga de trabajo:
- Arquitecturas de máquina virtual única: máquina virtual Linux y máquina virtual Windows
- Arquitectura fundamental que se centra en las recomendaciones de infraestructura: Virtual Machines arquitectura de línea base
Cree experiencia en la implementación mediante la siguiente documentación del producto:
- Máquinas virtuales
- Conjuntos de escalado de máquina virtual

Compartir a través de

Perspectiva de Azure Well-Architected Framework sobre Virtual Machines y conjuntos de escalado

Ámbito de la tecnología

Confiabilidad

Diseño de una lista de comprobación

Recomendaciones

Seguridad

Diseño de una lista de comprobación

Recomendaciones

Optimización de costos

Diseño de una lista de comprobación

Recomendaciones

Excelencia operativa

Diseño de una lista de comprobación

Recomendaciones

Eficiencia del rendimiento

Diseño de una lista de comprobación

Recomendaciones

Directivas de Azure

Recomendaciones de Azure Advisor

Pasos siguientes

Comentarios

Recursos adicionales