如何在 Microsoft Fabric 中建立自訂 Spark 集區

發行項
10/15/2024

本文件說明如何在 Microsoft Fabric 中為分析工作負載建立自訂 Apache Spark 集區。 Apache Spark 集區可讓用戶根據其特定需求建立量身打造的計算環境，以確保最佳的效能和資源使用率。

您可以指定自動調整的節點數目上線。根據這些值，系統會在作業的計算需求變更時動態取得和淘汰節點，進而高效地調整和改善效能。 Spark 集區中執行程式的動態配置也減少了對手動執行程式設定的需求。相反，系統會根據資料量和工作層級計算需求來調整執行程式的數目。此程序可讓您專注於工作負載，而不必擔心效能優化和資源管理。

注意

若要建立自訂 Spark 集區，您需要工作區的管理員存取權限。容量管理員必須在 [容量管理員設定] 的 [Spark 計算] 區段中啟用 [自訂工作區集區] 選項。若要深入了解，請參閱＜針對 Fabric 容量的 Spark 計算設定＞。

建立自訂 Spark 集區

若要建立或管理與您的工作區相關聯的 Spark 集區：

前往工作區並選取 [工作區設定]。
選取 [資料工程/科學] 選項以展開功能表，然後選取 [Spark 計算]。
選取 [+ 新增集區] 選項。在 [建立集區] 螢幕中，對 Spark 集區進行命名。此外，選擇 [節點系列]，並根據工作負載的計算需求從可用的大小 (小、中、大、超大和特大) 中選取 [節點大小]。
可以將自訂集區的最小節點組態設為 1。由於 Fabric Spark 為具有單一節點的叢集提供可還原的可用性，因此您不必擔心作業失敗、在失敗期間遺失工作階段，或為較小的 Spark 作業支付過多的計算費用。
您可以啟用或停用自訂 Spark 集區的自動調整。啟用自動調整後，集區會以動態方式取得新的節點，最多可達到使用者指定的節點數目上限，然後在作業執行后淘汰它們。此功能可根據作業需求調整資源，從而確保更好的效能。您可以調整節點的大小，使其符合在 Fabric 容量 SKU 中購買的容量單位。
您也可以選擇為 Spark 集區啟用動態執行程式配置，這會自動決定使用者指定上限內的最佳執行程式數目。此功能會根據資料量調整執行程式數目，進而改善效能和資源使用率。