Partager via


Problèmes courants : erreurs de configuration Slurm

Messages d’erreur possibles

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Résolution

Étant donné que Slurm nécessite que tous les nœuds d’un cluster soient définis dans slurm.conf, CycleCloud précrée toutes les machines virtuelles à l’intérieur de CycleCloud lorsque le nœud du planificateur est démarré pour la première fois. Ces machines virtuelles restent non allouées dans Azure jusqu’à ce qu’un travail les demande, mais parfois un quota insuffisant ou des limites de mise à l’échelle automatique incorrectes peuvent entraîner des problèmes d’installation.

  • Vérifiez que votre abonnement dispose d’un quota suffisant pour le type de machine virtuelle sélectionné et que les limites de mise à l’échelle automatique sont inférieures au montant du quota. Vous devrez peut-être sélectionner un autre type de machine virtuelle ou ajuster vos limites de mise à l’échelle automatique en conséquence.
  • /var/log/slurmctld/slurm.log Recherchez les erreurs liées au démarrage du planificateur.