Condividi tramite


Problemi comuni: errori di configurazione slurm

Possibili messaggi di errore

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Risoluzione

Poiché Slurm richiede che tutti i nodi di un cluster siano definiti in slurm.conf, CycleCloud pre-crea tutte le macchine virtuali all'interno di CycleCloud al primo avvio del nodo dell'utilità di pianificazione. Queste macchine virtuali rimangono non allocato in Azure fino a quando un processo non li richiede, ma a volte la quota insufficiente o i limiti di scalabilità automatica non corretti possono causare problemi di installazione.

  • Assicurarsi che la sottoscrizione disponga di una quota sufficiente per il tipo di macchina virtuale selezionato e che i limiti di scalabilità automatica siano inferiori all'importo della quota. Potrebbe essere necessario selezionare un tipo di macchina virtuale diverso o modificare i limiti di scalabilità automatica di conseguenza.
  • /var/log/slurmctld/slurm.log Verificare la presenza di eventuali errori correlati all'avvio dell'utilità di pianificazione.