共用方式為


Azure Batch 和可靠性

Azure Batch 可讓您在 Azure 中有效率地執行大規模的平行和高效能運算 (HPC) 批次工作。

Azure Batch 的用途:

  • 建立和管理計算節點 (虛擬機器) 的集區。
  • 安裝您想要執行的應用程式。
  • 排定要在計算節點上執行的作業。

下列各節包含 Azure Batch 專用的設計與設定檢查清單、建議設計,以及設定選項。

設計與設定檢查清單

設計您的工作負載和設定 Azure Batch 時,您是否考量到復原能力?


  • 持續更新所有區域中的應用程式二進位檔和參考資料。
  • 使用較少的作業與較多的工作。
  • 在不同區域中使用多個 Batch 帳戶,以允許您的應用程式在某個區域中的 Azure Batch 帳戶無法使用時,可繼續執行。
  • 建置持久的工作。
  • 在每個區域中預先建立所有必要的服務,例如 Batch 帳戶和儲存體帳戶。
  • 確保事先設定所有訂用帳戶的適當配額,以便您使用 Batch 帳戶來配置所需的核心數目。

設計和設定建議

探索下表中的建議,將您的工作負載設計和 Azure Batch 設定最佳化,以確保服務可靠性:

建議 描述
持續更新所有區域中的應用程式二進位檔和參考資料。 持續更新可確保區域能夠快速上線,而無須等候檔案上傳和部署。
使用較少的作業但較多的工作。 使用一項作業執行單一工作相當沒效率。 例如,相較於建立各包含 10 個工作的 100 項作業,使用包含 1000 個工作的單一作業會更有效率。 執行 1000 個作業,而每個作業包括單一工作,是效率最低、最緩慢且成本最高的方法。
在不同區域中使用多個 Batch 帳戶,以允許您的應用程式在某個區域中的 Azure Batch 帳戶無法使用時,可繼續執行。 對高可用性應用程式而言,具備多個帳戶是至關重要的。
建置持久的工作。 工作應該設計為可承受失敗並允許重試,尤其是針對長時間執行的工作。 請確保工作會產生相同的單一結果,即使多次執行工作也一樣。 達成相同結果的其中一種方式,就是讓您的工作進行「目標搜尋」。 另一種方式是確保您的工作具有「等冪性」 (不論工作執行多少次,都會有相同的結果)。
在每個區域中預先建立所有必要的服務,例如 Batch 帳戶和儲存體帳戶。 建立帳戶時通常不會產生任何費用,只有當您使用帳戶或儲存資料時,才會有費用產生。

提示

如需 Load Balancer 可靠性指引的詳細資訊,請參閱 Azure Batch 的可靠性

後續步驟