Węzły obliczeniowe HPC nie są wyświetlane lub są w stanie błędu
Ten artykuł zawiera rozwiązanie problemu, w którym węzły obliczeniowe nie są wyświetlane lub są w stanie błędu podczas wdrażania klastra obliczeń o wysokiej wydajności (HPC) na platformie Azure.
Symptomy
Po wdrożeniu klastra HPC na platformie Azure wdrożenie zakończy się pomyślnie, ale węzły obliczeniowe nie są wyświetlane lub są w stanie błędu. W dziennikach usługi HpcNodeManager w węźle obliczeniowym są widoczne błędy związane z certyfikatem i siecią.
Oto przykład błędu sieciowego:
System.Net.Sockets.SocketException: Próba połączenia nie powiodła się, ponieważ połączona strona nie odpowiedziała prawidłowo po upływie określonego czasu lub nawiązane połączenie nie powiodło się, ponieważ połączony host nie odpowiedział x.x.x.x:xxx
Przyczyna
Ten problem występuje z powodu problemów z konfiguracją sieci lub pewnego typu niezgodności certyfikatu.
Rozwiązanie
Sprawdź błędy sieci i certyfikatów w dziennikach usługi HpcNodeManager w węźle obliczeniowym.
Popraw niezgodności certyfikatów, jeśli istnieją. Aby uzyskać więcej informacji, zobacz Manage Certificates for HPC Pack 2019 Cluster (Zarządzanie certyfikatami dla klastra hpc pack 2019).
Aby rozwiązać problemy z siecią związane z powyższym błędem, skonfiguruj reguły sieciowej grupy zabezpieczeń i reguły zapory. Aby uzyskać więcej informacji, zobacz sekcję "Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure" w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure) w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Tworzenie klastra pakietów HPC Pack).
Skontaktuj się z nami, aby uzyskać pomoc
Jeśli masz pytania lub potrzebujesz pomocy, utwórz wniosek o pomoc techniczną lub zadaj pytanie w społeczności wsparcia dla platformy Azure. Możesz również przesłać opinię o produkcie do społeczności opinii platformy Azure.