Udostępnij za pośrednictwem


Węzły obliczeniowe HPC nie są wyświetlane lub są w stanie błędu

Ten artykuł zawiera rozwiązanie problemu, w którym węzły obliczeniowe nie są wyświetlane lub są w stanie błędu podczas wdrażania klastra obliczeń o wysokiej wydajności (HPC) na platformie Azure.

Symptomy

Po wdrożeniu klastra HPC na platformie Azure wdrożenie zakończy się pomyślnie, ale węzły obliczeniowe nie są wyświetlane lub są w stanie błędu. W dziennikach usługi HpcNodeManager w węźle obliczeniowym są widoczne błędy związane z certyfikatem i siecią.

Oto przykład błędu sieciowego:

System.Net.Sockets.SocketException: Próba połączenia nie powiodła się, ponieważ połączona strona nie odpowiedziała prawidłowo po upływie określonego czasu lub nawiązane połączenie nie powiodło się, ponieważ połączony host nie odpowiedział x.x.x.x:xxx

Przyczyna

Ten problem występuje z powodu problemów z konfiguracją sieci lub pewnego typu niezgodności certyfikatu.

Rozwiązanie

Sprawdź błędy sieci i certyfikatów w dziennikach usługi HpcNodeManager w węźle obliczeniowym.

Popraw niezgodności certyfikatów, jeśli istnieją. Aby uzyskać więcej informacji, zobacz Manage Certificates for HPC Pack 2019 Cluster (Zarządzanie certyfikatami dla klastra hpc pack 2019).

Aby rozwiązać problemy z siecią związane z powyższym błędem, skonfiguruj reguły sieciowej grupy zabezpieczeń i reguły zapory. Aby uzyskać więcej informacji, zobacz sekcję "Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure" w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure) w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Tworzenie klastra pakietów HPC Pack).

Skontaktuj się z nami, aby uzyskać pomoc

Jeśli masz pytania lub potrzebujesz pomocy, utwórz wniosek o pomoc techniczną lub zadaj pytanie w społeczności wsparcia dla platformy Azure. Możesz również przesłać opinię o produkcie do społeczności opinii platformy Azure.