可能的錯誤訊息
Unable to execute command /usr/bin/systemctl --system start slurmd
解決辦法
因為 Slurm 需要叢集的所有節點定義於 中 slurm.conf
,因此 CycleCloud 會在您第一次啟動排程器節點時,預先建立 CycleCloud 內的所有 VM。 這些 VM 會保留在 Azure 中未被分配使用,直到有作業請求它們,但有時候資源配額不足或自動調整限制設置不當會導致安裝問題。
- 請確定您的訂用帳戶有足夠的配額可供選取的 VM 類型使用,且自動調整限制低於配額數量。 您可能必須選取不同的 VM 類型,或調整自動調整的上下限。
- 檢查
/var/log/slurmctld/slurm.log
是否有與啟動排程器相關的錯誤。