共用方式為


常見問題:叢集設定錯誤

可能的錯誤訊息

  • Unable to execute command /usr/bin/systemctl --system start slurmd

解決方案

因為 Slurm 需要叢集的所有節點定義于 slurm.conf 中,所以 CycleCloud 會在第一次啟動排程器節點時,預先建立 CycleCloud 內的所有 VM。 這些 VM 在 Azure 中保持未配置,直到作業要求它們為止,但有時候配額不足或自動調整限制不正確可能會導致安裝問題。

  • 請確定您的訂用帳戶有足夠的配額可供選取的 VM 類型使用,且自動調整限制低於配額數量。 您可能必須選取不同的 VM 類型,或據以調整自動調整限制。
  • 檢查 /var/log/slurmctld/slurm.log 是否有任何與啟動排程器相關的錯誤。