Compartilhar via


Problemas comuns: erros de configuração de slurm

Possíveis mensagens de erro

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Resolução

Como o Slurm exige que todos os nós de um cluster sejam definidos em slurm.conf, o CycleCloud cria previamente todas as VMs dentro do CycleCloud quando o nó do agendador é iniciado pela primeira vez. Essas VMs permanecem não alocadas no Azure até que um trabalho as solicite, mas, às vezes, cota insuficiente ou limites de dimensionamento automático incorretos podem causar problemas de instalação.

  • Verifique se sua assinatura tem cota suficiente para o tipo de VM selecionado e se os limites de dimensionamento automático estão abaixo do valor da cota. Talvez seja necessário selecionar um tipo de VM diferente ou ajustar seus limites de dimensionamento automático de acordo.
  • /var/log/slurmctld/slurm.log Verifique se há erros relacionados ao início do agendador.