HPC-beräkningsnoder visas inte eller är i feltillstånd

Den här artikeln innehåller en lösning på ett problem där beräkningsnoder inte visas eller är i feltillstånd när du distribuerar ett HPC-kluster (databehandling med höga prestanda) i Azure.

Symptom

När du distribuerar ett HPC-kluster i Azure lyckas distributionen, men beräkningsnoder visas inte eller är i feltillstånd. Du ser certifikat- och nätverksrelaterade fel i HpcNodeManager-tjänstloggarna på beräkningsnoden.

Här är ett exempel på nätverksfel:

System.Net.Sockets.SocketException: Ett anslutningsförsök misslyckades på grund av att den anslutna parten inte svarade korrekt efter en viss tidsperiod, eller att den upprättade anslutningen misslyckades eftersom den anslutna värden inte svarade x.x.x.x:xxx

Orsak

Det här problemet uppstår på grund av problem med nätverkskonfigurationen eller någon typ av felmatchning av certifikat.

Åtgärd

Kontrollera nätverks- och certifikatfel i HpcNodeManager-tjänstloggarna på beräkningsnoden.

Korrigera felmatchade certifikat om det finns några. Mer information finns i Hantera certifikat för HPC Pack 2019-kluster.

Om du vill lösa nätverksproblem med felet ovan konfigurerar du regler för nätverkssäkerhetsgruppen och brandväggsregler. Mer information finns i avsnittet "Konfigurera nätverkssäkerhetsgrupp för virtuellt Azure-nätverk" i Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurera nätverkssäkerhetsgrupp för virtuellt Azure-nätverk) i Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurera nätverkssäkerhetsgrupp för virtuellt Azure-nätverk) i Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurera nätverkssäkerhetsgrupp för virtuellt Azure-nätverk) i Burst to