Azure Batch 和可靠性
Azure Batch 可讓您在 Azure 中有效率地執行大規模的平行和高效能運算 (HPC) 批次工作。
Azure Batch 的用途:
- 建立和管理計算節點 (虛擬機器) 的集區。
- 安裝您想要執行的應用程式。
- 排定要在計算節點上執行的作業。
下列各節包含 Azure Batch 專用的設計與設定檢查清單、建議設計,以及設定選項。
設計與設定檢查清單
設計您的工作負載和設定 Azure Batch 時,您是否考量到復原能力?
- 持續更新所有區域中的應用程式二進位檔和參考資料。
- 使用較少的作業與較多的工作。
- 在不同區域中使用多個 Batch 帳戶,以允許您的應用程式在某個區域中的 Azure Batch 帳戶無法使用時,可繼續執行。
- 建置持久的工作。
- 在每個區域中預先建立所有必要的服務,例如 Batch 帳戶和儲存體帳戶。
- 確保事先設定所有訂用帳戶的適當配額,以便您使用 Batch 帳戶來配置所需的核心數目。
設計和設定建議
探索下表中的建議,將您的工作負載設計和 Azure Batch 設定最佳化,以確保服務可靠性:
建議 | 描述 |
---|---|
持續更新所有區域中的應用程式二進位檔和參考資料。 | 持續更新可確保區域能夠快速上線,而無須等候檔案上傳和部署。 |
使用較少的作業但較多的工作。 | 使用一項作業執行單一工作相當沒效率。 例如,相較於建立各包含 10 個工作的 100 項作業,使用包含 1000 個工作的單一作業會更有效率。 執行 1000 個作業,而每個作業包括單一工作,是效率最低、最緩慢且成本最高的方法。 |
在不同區域中使用多個 Batch 帳戶,以允許您的應用程式在某個區域中的 Azure Batch 帳戶無法使用時,可繼續執行。 | 對高可用性應用程式而言,具備多個帳戶是至關重要的。 |
建置持久的工作。 | 工作應該設計為可承受失敗並允許重試,尤其是針對長時間執行的工作。 請確保工作會產生相同的單一結果,即使多次執行工作也一樣。 達成相同結果的其中一種方式,就是讓您的工作進行「目標搜尋」。 另一種方式是確保您的工作具有「等冪性」 (不論工作執行多少次,都會有相同的結果)。 |
在每個區域中預先建立所有必要的服務,例如 Batch 帳戶和儲存體帳戶。 | 建立帳戶時通常不會產生任何費用,只有當您使用帳戶或儲存資料時,才會有費用產生。 |
提示
如需 Load Balancer 可靠性指引的詳細資訊,請參閱 Azure Batch 的可靠性。