Les nœuds de calcul HPC ne sont pas affichés ou sont dans un état d’erreur
Cet article fournit une solution à un problème dans lequel les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur lorsque vous déployez un cluster de calcul haute performance (HPC) sur Azure.
Symptômes
Lorsque vous déployez un cluster HPC sur Azure, le déploiement réussit, mais les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur. Vous voyez des erreurs liées au certificat et au réseau dans les journaux du service HpcNodeManager sur le nœud de calcul.
Voici un exemple d’erreur réseau :
System.Net.Sockets.SocketException : une tentative de connexion a échoué car le tiers connecté n’a pas répondu correctement après un certain temps, ou la connexion établie a échoué car l’hôte connecté n’a pas pu répondre x.x.x.x :xxx
Cause
Ce problème se produit en raison de problèmes de configuration réseau ou d’un type d’incompatibilité de certificat.
Résolution
Vérifiez les erreurs de réseau et de certificat dans les journaux du service HpcNodeManager sur le nœud de calcul.
Corrigez les incompatibilités de certificat le cas échéant. Pour plus d’informations, consultez Gérer les certificats pour le cluster HPC Pack 2019.
Pour résoudre les problèmes réseau liés à l’erreur ci-dessus, configurez les règles de groupe de sécurité réseau et les règles de pare-feu. Pour plus d’informations, consultez la section « Configurer un groupe de sécurité réseau pour un réseau virtuel Azure » dans Burst to Azure IaaS VM from an HPC Pack Cluster.
Contactez-nous pour obtenir de l’aide
Pour toute demande ou assistance, créez une demande de support ou posez une question au support de la communauté Azure. Vous pouvez également soumettre des commentaires sur les produits à la communauté de commentaires Azure.