Compartir a través de


Solución de problemas básica de errores de Node Not Ready

En este artículo se proporcionan pasos de solución de problemas para recuperar nodos de clúster de Microsoft Azure Kubernetes Service (AKS) después de un error. En este artículo se abordan específicamente los mensajes de error más comunes que se generan cuando se produce un error node not ready y se explica cómo se puede realizar la funcionalidad de reparación de nodos para los nodos de Windows y Linux.

Antes de empezar

Lea la guía oficial para solucionar problemas de clústeres de Kubernetes. Lea también la guía del ingeniero de Microsoft para solucionar problemas de Kubernetes. Esta guía contiene comandos para solucionar problemas de pods, nodos, clústeres y otras características.

Requisitos previos

  • CLI de Azure, versión 2.31 o una versión posterior. Si la CLI de Azure ya está instalada, puede encontrar el número de versión ejecutando az --version.

Solución de problemas básico

AKS supervisa continuamente el estado de mantenimiento de los nodos de trabajo y repara automáticamente los nodos si se vuelven incorrectos. La plataforma Azure Virtual Machine (VM) mantiene las máquinas virtuales que experimentan problemas. AKS y las máquinas virtuales de Azure funcionan conjuntamente para reducir las interrupciones del servicio en los clústeres.

Para los nodos, hay dos formas de latidos:

En comparación con las actualizaciones del archivo .status de , Nodees Lease un recurso ligero. El uso Lease de objetos para latidos reduce el impacto en el rendimiento de estas actualizaciones para clústeres grandes.

Kubelet es responsable de crear y actualizar el archivo .status para objetosNode. También es responsable de actualizar los Lease objetos relacionados con los Node objetos.

Kubelet actualiza el Node archivo .status si se cumple una de las condiciones siguientes:

  • Se produce un cambio en el estado.

  • No se produce ninguna actualización después de un intervalo de tiempo configurado.

El intervalo predeterminado para las actualizaciones de estado en es de Node cinco minutos. Este intervalo es mucho más largo que el tiempo de espera predeterminado de 40 segundos para los nodos inaccesibles. Kubelet crea y actualiza su Lease objeto una vez cada diez segundos (el intervalo de actualización predeterminado). Novedades que Lease se produzca independientemente de las actualizaciones del Node estado. Si se produce un error en la Lease actualización, el kubelet vuelve a intentarse mediante un retroceso exponencial que comienza en 200 milisegundos y se limita a un máximo de siete segundos.

No se puede programar en un PodNode objeto que tenga un estado de NotReady o Unknown. Puede programar un Pod solo en los nodos que se encuentran en el Ready estado .

Si el nodo está en el MemoryPressureestado , DiskPressureo PIDPressure , debe administrar los recursos para programar pods adicionales en el nodo. Si el nodo está en NetworkUnavailable modo, debe configurar la red en el nodo correctamente. Asegúrese de que se cumplen las condiciones siguientes:

  • El clúster está en estado Correcto (en ejecución). Para comprobar el estado del clúster en el Azure Portal, busque y seleccione Servicios de Kubernetes y seleccione el nombre del clúster de AKS. A continuación, en la página Información general del clúster, busque en Essentials para buscar el estado. O bien, escriba el comando az aks show en la CLI de Azure.

    Azure Portal captura de pantalla de una página de información general de un clúster de Azure Kubernetes Service (A K S). En la sección Essentials, el estado es

  • El grupo de nodos tiene un estado de aprovisionamientocorrecto y un estado de energía en ejecución. Para comprobar el estado del grupo de nodos en la Azure Portal, vuelva a la página del clúster de AKS y, a continuación, seleccione Grupos de nodos. Como alternativa, escriba el comando az aks nodepool show en la CLI de Azure.

    Azure Portal captura de pantalla de un grupo de nodos de clúster de Azure Kubernetes Service (A K S). El estado de aprovisionamiento es Correcto. El estado Power está en ejecución.

  • Los puertos de salida necesarios están abiertos en los grupos de seguridad de red (NSG) y el firewall para que se pueda acceder a la dirección IP del servidor de API. Para obtener más información, consulte Reglas de red salientes necesarias y FQDN para clústeres de AKS.

  • Los nodos han implementado las imágenes de nodo más recientes.

  • Los nodos están en el Running estado en lugar de Stopped o Deallocated.

  • El clúster ejecuta una versión compatible con AKS de Kubernetes.

Aviso de declinación de responsabilidades sobre la información de contacto de terceros

Microsoft proporciona información de contacto de otros proveedores para ayudarle a encontrar información adicional sobre este tema. Dicha información de contacto puede cambiar sin notificación previa. Microsoft no garantiza la precisión de esta información de contacto de terceros.