Problemas comuns: erros de configuração de slurm
Possíveis mensagens de erro
Unable to execute command /usr/bin/systemctl --system start slurmd
Resolução
Como o Slurm exige que todos os nós de um cluster sejam definidos em slurm.conf, o CycleCloud cria previamente todas as VMs dentro do CycleCloud quando o nó do agendador é iniciado pela primeira vez. Essas VMs permanecem não alocadas no Azure até que um trabalho as solicite, mas, às vezes, cota insuficiente ou limites de dimensionamento automático incorretos podem causar problemas de instalação.
- Verifique se sua assinatura tem cota suficiente para o tipo de VM selecionado e se os limites de dimensionamento automático estão abaixo do valor da cota. Talvez seja necessário selecionar um tipo de VM diferente ou ajustar seus limites de dimensionamento automático de acordo.
-
/var/log/slurmctld/slurm.log
Verifique se há erros relacionados ao início do agendador.