Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure VMware Solution realiza un mantenimiento periódico de la nube privada. Este mantenimiento incluye revisiones de seguridad, actualizaciones secundarias y principales de la pila de software de VMware. En esta página se describen el monitoreo del host, la remediación y los procedimientos recomendados que ayudan a mantener la nube privada lista para el mantenimiento.
Mantenimiento y administración del ciclo de vida de hosts
Una de las ventajas de las nubes privadas de Azure VMware Solution es que la plataforma se mantiene automáticamente. Microsoft es responsable de la administración del ciclo de vida del software de VMware (ESXi, vCenter Server y vSAN) y de los dispositivos NSX. También se encarga de la configuración de la red de arranque, como la creación de la puerta de enlace de nivel 0 y la habilitación del enrutamiento vertical de arriba abajo. Usted es responsable de la configuración de NSX SDN: segmentos de red, reglas de firewall distribuidas, puertas de enlace de nivel 1 y equilibradores de carga.
Nota:
Se crea y configura una puerta de enlace T0 como parte de una implementación de nube privada. Cualquier modificación en el enrutador lógico o en las máquinas virtuales del nodo perimetral de NSX podría afectar a la conectividad con la nube privada, por lo que se debe evitar.
Microsoft es responsable de aplicar revisiones, actualizaciones o actualizaciones a ESXi, vCenter Server, vSAN y NSX en la nube privada. El impacto de las revisiones, actualizaciones y actualizaciones en ESXi, vCenter Server y NSX tiene las siguientes consideraciones:
ESXi : no hay ningún impacto en las cargas de trabajo que se ejecutan en la nube privada. El acceso a vCenter Server y NSX no se bloquea durante este tiempo. Durante este tiempo, se recomienda no planear otras actividades, como: el escalado vertical de la nube privada, la programación o inicio de migraciones de HCX activas y los cambios de configuración en HCX, entre otras, en la nube privada.
vCenter Server : no hay ningún impacto en las cargas de trabajo que se ejecutan en la nube privada. Durante este tiempo, vCenter Server no estará disponible y no será posible administrar máquinas virtuales (detener, iniciar, crear o eliminar). Se recomienda no planear otras actividades, como el escalado vertical de la nube privada o la creación de redes nuevas, entre otras, en la nube privada. Al usar VMware Site Recovery Manager o interfaces de usuario de replicación de vSphere, se recomienda no realizar ninguna de las siguientes acciones: configurar las replicaciones de vSphere, así como configurar o ejecutar planes de Site Recovery, durante la actualización de vCenter Server.
NSX : la carga de trabajo se ve afectada. Cuando se actualice un host determinado, las máquinas virtuales de ese host podrían perder una conectividad de entre 2 segundos y 1 minuto con cualquiera de los síntomas siguientes:
Errores de ping
Pérdida de paquetes
Mensajes de error (por ejemplo, Host de destino inaccesible y Net inaccesible)
Durante esta ventana de actualización, se bloquea todo el acceso al plano de administración de NSX. No puede realizar cambios de configuración en el entorno de NSX mientras dure. Las cargas de trabajo seguirán ejecutándose de forma normal, en función del impacto de la actualización que se detalló anteriormente.
Durante la actualización, se recomienda no planear otras actividades, como el escalado vertical de la nube privada, entre otras, en la nube privada. Otras actividades pueden impedir que se inicie la actualización o pueda tener efectos negativos en la actualización y el entorno.
Recibirá una notificación mediante Azure Service Health incluyendo la escala de tiempo de la actualización. En esta notificación también se proporcionan detalles sobre el componente actualizado, su efecto en las cargas de trabajo, el acceso a la nube privada y otros servicios de Azure. Puede volver a programar una actualización según sea necesario.
Entre las actualizaciones de software se incluyen las siguientes:
Revisiones: revisiones de seguridad o correcciones de errores publicadas por VMware
Actualizaciones : cambio de versión secundaria de un componente de pila de VMware
Actualizaciones: cambio de versión principal de un componente de pila de VMware
Nota:
Microsoft prueba una revisión de seguridad crítica en cuanto está disponible desde VMware.
Se implementan soluciones documentadas de VMware en lugar de instalar una revisión correspondiente hasta que se implementan las siguientes actualizaciones programadas.
Supervisión y corrección de host
Azure VMware Solution supervisa continuamente el estado de los subyacentes y los componentes de VMware. Cuando Azure VMware Solution detecta un error, toma medidas para reparar los componentes que no funcionan. Cuando Azure VMware Solution detecta una degradación o un error en un nodo de Azure VMware Solution, desencadena el proceso de corrección del host.
La corrección del host implica reemplazar el nodo defectuoso por un nuevo nodo en buen estado en el clúster. A continuación, cuando sea posible, el host defectuoso se coloca en el modo de mantenimiento VMware vSphere. VMware vSphere vMotion mueve las máquinas virtuales fuera del host defectuoso a otros servidores disponibles del clúster, lo que podría permitir un tiempo de inactividad cero para la migración en vivo de cargas de trabajo. Si el host defectuoso no se puede poner en modo de mantenimiento, se quita del clúster. Antes de quitar el host defectuoso, las cargas de trabajo del cliente se migran a un host recién agregado.
Sugerencia
Comunicación con el cliente: se envía un correo electrónico a la dirección de correo electrónico del cliente antes de que se inicie el reemplazo y, nuevamente, después de que el reemplazo se realice correctamente.
Para recibir correos electrónicos relacionados con el reemplazo de host, debe agregarse a cualquiera de los siguientes roles de Azure Role-Based Access Control (RBAC) en la suscripción: "ServiceAdmin", "CoAdmin", "Propietario", "Colaborador".
Azure VMware Solution supervisa las siguientes condiciones en el host:
- Estado del procesador
- Estado de la memoria
- Estado de conexión y energía
- Estado del ventilador de hardware
- Pérdida de conectividad de red
- Estado de la placa del sistema de hardware
- Errores en uno o varios discos de un host de vSAN
- Voltaje de hardware
- Estado de la temperatura de hardware
- Estado de la energía de hardware
- Estado de almacenamiento
- Error de conexión
Procedimientos recomendados de operaciones de mantenimiento
Las siguientes acciones siempre se recomiendan para garantizar que las operaciones de mantenimiento del host se realicen correctamente:
- Uso del almacenamiento de vSAN: Para mantener el Acuerdo de Nivel de Servicio (SLA), asegúrese de que el uso del espacio de almacenamiento del clúster de vSphere sigue siendo inferior a 75%. Si el uso supera los 75%, las actualizaciones pueden tardar más de lo esperado o producir errores por completo. Si el uso del almacenamiento supera los 75%, considere la posibilidad de agregar un nodo para expandir el clúster y evitar posibles tiempos de inactividad durante las actualizaciones.
- Reglas del Distributed Resource Scheduler (DRS): Las reglas de antiafinidad DRS VM-VM deben configurarse de modo que haya al menos (N+1) hosts en el clúster, donde N es el número de máquinas virtuales en la regla de DRS.
- Violación de Fallos a Tolerar (FTT): Para evitar la pérdida de datos, cambie las máquinas virtuales configuradas con una política de almacenamiento vSAN para Fallos a Tolerar (FTT) de 0 a una política de almacenamiento vSAN compatible con el SLA de Microsoft (FTT=1 para hasta cinco hosts en un clúster y FTT=2 para seis o más hosts en un clúster) y asegúrese de que las operaciones de mantenimiento del host se puedan realizar sin interrupciones.
- Quite los montajes de CD-ROM de la máquina virtual: las máquinas virtuales montadas con CD-ROM en "modo Emular" bloquean el mantenimiento del host. Asegúrese de que los CD-ROM estén montados en "Modo de acceso directo".
- Puerto serie/paralelo o dispositivo externo: Si usa un archivo de imagen (ISO, FLP, etc.), asegúrese de que es accesible desde todos los hosts ESXi del clúster. Almacene los archivos en un almacén de datos que se comparten entre todos los servidores ESXi que participan en vMotion de la máquina virtual. Para obtener más información, consulte el artículo broadcom KB.
- Máquinas virtuales huérfanas: En el caso de una máquina virtual huérfana, la máquina virtual (VM) debe volver a registrarse si es posible (si no se ha eliminado) o quitarse del inventario. Para obtener más información, consulte el artículo broadcom KB.
- Controlador compartido SCSI: Al utilizar el compartir de bus SCSI, configure el tipo de bus como "Físico" para las máquinas virtuales. Las máquinas virtuales conectadas a controladores scSCI virtuales se apagarán. Para obtener más información, consulte el artículo broadcom KB.
-
Aplicaciones y máquinas virtuales de terceros: Para máquinas virtuales y aplicaciones de terceros:
- Asegúrese de que las soluciones de terceros implementadas en Azure VMware Solution son compatibles y no interfieren con las operaciones de mantenimiento.
- Asegúrese de que la máquina virtual no está instalada con una regla de DRS "Debe ejecutarse" de VM-Host. Además, compruebe que estas aplicaciones son compatibles con las próximas versiones del conjunto de VMware.
- Consulte con el proveedor de la solución y actualice con antelación si es necesario para mantener la compatibilidad después de la actualización.
Tabla de códigos de alerta y corrección
Código de error | Detalles del error | Acción recomendada |
---|---|---|
EPC_CDROM_EMULATEMODE | Este error se produce cuando CD-ROM en la máquina virtual usa el modo emular, cuya imagen ISO no es accesible | Siga este artículo de Knowledge Base para la eliminación de cualquier CDROM montado en las máquinas virtuales de carga de trabajo del cliente en modo emular o desasociar ISO. Se recomienda usar el "modo Passthrough" para montar cualquier CD-ROM. |
EPC_DRSOVERRIDERULE | Este error se produce cuando hay una máquina virtual con "DRS Override" establecida en el modo "Deshabilitado". | La máquina virtual no debe bloquear vMotion al colocar el host en mantenimiento. Establezca reglas de DRS parcialmente automatizadas para la máquina virtual. Consulte este documento para más información sobre las directivas de selección de ubicación de máquinas virtuales. |
EPC_SCSIDEVICE_SHARINGMODE | Este error se produce cuando una máquina virtual está configurada para usar un dispositivo que impide una operación de mantenimiento: un dispositivo que es un controlador de SCSI que está implicado en el uso compartido de buses | Siga este artículo de KB para la eliminación de cualquier controlador SCSI implicado en el uso compartido de bus conectado a máquinas virtuales. |
EPC_DATASTORE_INACCESSIBLE | Este error se produce cuando no se puede acceder a cualquier almacén de datos externo asociado a la nube privada de AVS | Siga este artículo para la eliminación de cualquier almacén de datos obsoleto asociado al clúster. |
EPC_NWADAPTER_STALE | Este error se produce cuando la interfaz de red conectada en la máquina virtual usa el adaptador de red que deja de estar accesible | Siga este artículo de KB para la eliminación de los adaptadores N/W obsoletos conectados a máquinas virtuales. |
EPC_SERIAL_PORT | Este error se produce cuando el puerto serie de una máquina virtual está conectado a un dispositivo al que no se puede acceder en el host de destino. | Si usa un archivo de imagen (ISO, FLP, etc.), asegúrese de que es accesible desde todos los servidores ESXi del clúster. Almacene los archivos en un almacén de datos que se comparte entre todos los servidores ESXi que participan en vMotion de la máquina virtual. Consulte este artículo de KB de Broadcom para obtener más información. |
EPC_HARDWARE_DEVICE | Este error se encuentra cuando el puerto paralelo o el dispositivo USB de una máquina virtual está conectado a un dispositivo que no se puede acceder en el host de destino. | Si usa un archivo de imagen (ISO, FLP, etc.), asegúrese de que es accesible desde todos los servidores ESXi del clúster. Almacene los archivos en un almacén de datos que se comparte entre todos los servidores ESXi que participan en vMotion de la máquina virtual. Consulte este artículo de KB de Broadcom para obtener más información. |
EPC_INVALIDVM/EPC_ORPHANVM | Este error se produce cuando hay una máquina virtual huérfana o no válida en el inventario. | Asegúrese de que todas las máquinas virtuales son accesibles para vCenter. Consulte este artículo de KB para obtener más información. |
Nota:
Los administradores de inquilinos de Azure VMware Solution no deben editar ni eliminar las alarmas de VMware vCenter Server definidas anteriormente porque están administradas por el plano de control de Azure VMware Solution en vCenter Server. La funcionalidad de supervisión de Azure VMware Solution usa estas alarmas para desencadenar el proceso de corrección del host de Azure VMware Solution.
Pasos siguientes
Ahora que ha tratado los procedimientos recomendados de mantenimiento de la nube privada de Azure VMware Solution, es posible que quiera obtener información sobre: