Los nodos de proceso de HPC no se muestran o están en estado de error
En este artículo se proporciona una solución para un problema en el que los nodos de proceso no se muestran o se encuentran en un estado de error al implementar un clúster de informática de alto rendimiento (HPC) en Azure.
Síntomas
Al implementar un clúster de HPC en Azure, la implementación se realiza correctamente, pero los nodos de proceso no se muestran o están en un estado de error. Verá errores relacionados con el certificado y la red en los registros del servicio HpcNodeManager en el nodo de proceso.
Este es un ejemplo de error de red:
System.Net.Sockets.SocketException: error en un intento de conexión porque la parte conectada no respondió correctamente después de un período de tiempo o se produjo un error en la conexión establecida porque el host conectado no ha podido responder a x.x.x.x:xxx.
Causa
Este problema se produce debido a problemas de configuración de red o a algún tipo de error de coincidencia de certificado.
Solución
Compruebe los errores de red y certificado en los registros del servicio HpcNodeManager en el nodo de proceso.
Corrija las discrepancias de certificado si hay alguna. Para obtener más información, consulte Administración de certificados para el clúster de HPC Pack 2019.
Para resolver problemas de red con el error anterior, configure las reglas de grupo de seguridad de red y las reglas de firewall. Para obtener más información, consulte la sección "Configurar el grupo de seguridad de red para la red virtual de Azure" en Ráfaga a máquina virtual IaaS de Azure desde un clúster de HPC Pack.
Ponte en contacto con nosotros para obtener ayuda
Si tiene preguntas o necesita ayuda, cree una solicitud de soporte o busque consejo en la comunidad de Azure. También puede enviar comentarios sobre el producto con los comentarios de la comunidad de Azure.