Partager via


Les nœuds de calcul HPC ne sont pas affichés ou sont dans un état d’erreur

Cet article fournit une solution à un problème dans lequel les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur lorsque vous déployez un cluster de calcul haute performance (HPC) sur Azure.

Symptômes

Lorsque vous déployez un cluster HPC sur Azure, le déploiement réussit, mais les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur. Vous voyez des erreurs liées au certificat et au réseau dans les journaux du service HpcNodeManager sur le nœud de calcul.

Voici un exemple d’erreur réseau :

System.Net.Sockets.SocketException : une tentative de connexion a échoué car le tiers connecté n’a pas répondu correctement après un certain temps, ou la connexion établie a échoué car l’hôte connecté n’a pas pu répondre x.x.x.x :xxx

Cause

Ce problème se produit en raison de problèmes de configuration réseau ou d’un type d’incompatibilité de certificat.

Résolution

Vérifiez les erreurs de réseau et de certificat dans les journaux du service HpcNodeManager sur le nœud de calcul.

Corrigez les incompatibilités de certificat le cas échéant. Pour plus d’informations, consultez Gérer les certificats pour le cluster HPC Pack 2019.

Pour résoudre les problèmes réseau liés à l’erreur ci-dessus, configurez les règles de groupe de sécurité réseau et les règles de pare-feu. Pour plus d’informations, consultez la section « Configurer un groupe de sécurité réseau pour un réseau virtuel Azure » dans Burst to Azure IaaS VM from an HPC Pack Cluster.

Contactez-nous pour obtenir de l’aide

Pour toute demande ou assistance, créez une demande de support ou posez une question au support de la communauté Azure. Vous pouvez également soumettre des commentaires sur les produits à la communauté de commentaires Azure.