設定網狀架構筆記本的高並行模式
當您在 Microsoft Fabric 中執行筆記本時,會啟動 Apache Spark 會話,並用來執行在筆記本數據格執行期間提交的查詢。 啟用高並行模式時,不需要在每次執行筆記本時啟動新的Spark工作階段。
如果您已經執行高並行會話,您可以將筆記本附加至高並行會話,以立即取得Spark會話來執行查詢,並達到更高的會話使用率。
注意
高併行模式會話共用一律在單一使用者界限內。 筆記本必須具有相符的Spark組態,應該是相同工作區的一部分,共用相同的預設Lakehouse和連結庫來共用單一Spark會話。
會話共享條件
若要讓筆記本共享單一Spark工作階段,他們必須:
- 由同一位用戶執行。
- 擁有相同的預設湖屋。 沒有預設 Lakehouse 的筆記本可以與其他沒有預設 Lakehouse 的筆記本共享會話。
- 具有相同的 Spark 計算組態。
- 擁有相同的連結庫套件。 您可以將不同的內嵌連結庫安裝當做筆記本數據格的一部分,並且仍然與具有不同連結庫相依性的筆記本共享會話。
設定高並行模式
根據預設,所有網狀架構工作區都會以高並行模式啟用。 使用下列步驟來設定高併行功能:
按兩下網狀架構工作區中的 [ 工作區設定 ] 選項
流覽至 Synapse 區段> Spark 計算>高並行
在 [ 高并行] 區段中,您可以選擇 啟用 或 停用 設定。
啟用高並行選項可讓使用者在其筆記本中啟動高並行會話,或附加至現有的高並行會話。
停用高並行模式會隱藏 區段以設定閑置期間,也會隱藏從筆記本功能表啟動新高並行會話的選項。
在高並行會話中執行筆記本
開啟 [網狀架構] 工作區
建立筆記本或開啟現有的筆記本
流覽至功能區中的[執行] 索引標籤,然後選取 [標準] 選取為預設選項的工作階段類型下拉式清單。
選取 [ 新增高並行會話]。
啟動高並行會話之後,您現在可以在高並行會話中新增最多 5 個筆記本。
建立新的筆記本,並流覽至 上述步驟中所述的 [執行 ] 功能表,在下拉功能表中,您現在會看到新建立的高並行會話列出。
選取現有的高並行會話會將第二個筆記本附加至會話。
附加筆記本之後,您可以立即開始執行筆記本步驟。
高並行會話狀態也會顯示在任何時間點附加至指定會話的筆記本數目。
如果您覺得連結至高並行會話的筆記本需要更專用的計算,您可以選擇選擇將筆記本切換至標準會話,方法是選取 [執行] 功能表索引標籤中的 [高併行] 選項,將筆記本中斷連結。
您可以瀏覽至 狀態 列來檢視工作階段狀態、類型和會話標識碼,選取 [會話 標識符] 可讓您探索在這個高並行會話中執行的作業,並在 [監視詳細數據] 頁面中檢視 Spark 會話的記錄。
在高並行會話中執行的監視和偵錯筆記本
當您在共用會話中執行多個筆記本時,監視和偵錯通常是非簡單的工作。 針對 Fabric 中的高併行模式,會提供記錄區隔,讓使用者能夠追蹤來自不同筆記本的 Spark 事件所發出的記錄。
當工作階段處於進行中或已完成狀態時,您可以流覽至 [執行 ] 功能表並選取 [所有執行] 選項,以檢視會話狀態
這會開啟筆記本的執行歷程記錄,其中顯示目前作用中和歷史Spark會話的清單
用戶可以選取會話來存取監視詳細數據檢視,其中顯示已在會話中執行的所有Spark作業清單。
在高並行會話的情況下,使用者可以使用 [相關筆記本] 索引卷標,從 不同的筆記本識別作業及其相關聯的記錄,其中會顯示該作業執行所在的筆記本 。
相關內容
在本檔中,您會透過筆記本中的高並行模式,取得會話共用的基本瞭解。 請前往下一篇文章,瞭解如何使用 Lakehouse 和 Notebooks 建立並開始使用您自己的 資料工程師 體驗:
- 若要開始使用 Lakehouse,請參閱 建立 Lakehouse。
- 若要開始使用筆記本,請參閱 如何使用筆記本