Microsoft Fabric 筆記本是開發 Apache Spark 工作與機器學習實驗的主要程式碼項目。 它是一個基於網頁的互動介面,供資料科學家和資料工程師使用,撰寫程式碼,並利用豐富的視覺化和 Markdown 文本。 資料工程師撰寫程式碼來擷取資料、資料準備和資料轉換。 資料科學家也會使用筆記本來建立machine learning解決方案,包括建立實驗與模型、模型追蹤及部署。
使用 Fabric 筆記本,你可以:
- 現在開始,完全不需任何設定。
- 使用直覺式低程式碼體驗輕鬆探索和處理資料。
- 使用內建的企業安全性功能保護資料的安全。
- 使用強大的 Spark 功能,分析原始格式(例如 CSV、txt、JSON 等)和處理過的檔案格式(例如 parquet、Delta Lake 等)。
- 透過增強的撰寫功能和內建的資料視覺效果,提高生產力。
- 善用 Copilot 在你的筆記本上進行情境感知的程式碼生成、重構與驗證。
- 使用 Fix with Copilot 快速診斷並修復失敗的單元或 Spark 工作,並包括基於核准的程式碼變更。
本文說明如何在資料科學和資料工程體驗中使用筆記本。
執行筆記本的安全性環境
筆記本執行可透過三種方式觸發,每種方式都有不同的安全情境:
- 互動式執行:你透過 UI 或 REST API 手動觸發執行。 筆記本會在你的安全環境中(當前使用者)執行。
- Run as pipeline activity:執行由 Fabric Data Factory 管道觸發。 詳情請參見 筆記本活動 。 筆記本是以 管線最後修改的使用者身份執行——而非管線擁有者或筆記本擁有者。 這表示管線最後的編輯者會決定資料存取、API 呼叫和權限的安全上下文。
- 排程器:執行由排程執行觸發。 筆記本以建立或最後更新排程的使用者身份運作。
透過 API 自動化執行
你也可以透過 Job Scheduler API 按需執行筆記本。 API 觸發的執行支援參數化執行、會話設定(如計算 vCore 與 Spark 設定)、環境與執行時選擇,以及選擇目標 Fabric Lakehouse。 你可以透過同一個 API 監控執行狀態並取消工作實例。 執行會回傳一個出口值,外部排程器與 Fabric 管線可讀取此值,以啟用條件編排與下游訊號。
Items REST API 與 Job Scheduler API 皆支援服務主體認證,以實現安全的無人值守自動化與 CI/CD。 請注意,有些下游服務(例如 T-SQL 端點)不支援服務主體,而是需要使用者主體。
這些執行選項在不同情境下提供了彈性,但你必須了解哪個身份在運行你的筆記本。 安全情境影響資料access權限、API 呼叫授權及資源可用性。
第一次建立筆記本時,會顯示提醒訊息,以警告您在未檢閱程式碼的情況下執行它的風險。
請遵循以下最佳實務以避免安全問題:
- 手動執行筆記本前:先確認最後修改的是誰,並使用版本歷史面板查看實際內容變更,再執行你沒寫的程式碼。
- 在將筆記本加入管線前:確認最後修改管線的是誰,因為該筆記本是以該使用者的身份運作。 從流程中打開筆記本,檢視最新內容。 如果該身份沒有所需的權限(或某些 API 需要用使用者主體而非服務主體),請讓相應的使用者編輯管線以更新最後修改的身份。
- 在建立或更新排程前:筆記本會以建立或更新排程者的身份執行。 確保使用者擁有筆記本中所有操作所需的權限。
- 使用工作區階段:將工作區分為開發、測試和生產階段。 限制生產工作空間的存取權限僅限於受信任的使用者。
建立筆記本
您可以建立新的筆記本或匯入現有筆記本。
建立新的筆記本
和其他標準的 Fabric 項目建立流程一樣,你可以從 Fabric
關於特定工作流程中的逐步筆記本製作指引,請參見:
- 在你的湖屋中利用筆記本來探索資料,在 Fabric 入口網站的湖屋上下文中創建筆記本。
- 利用 Visual Studio Code 編寫 Microsoft Fabric 筆記本,用於從 VS Code 建立筆記本。
- 用於透過 Items REST API(CRUD 操作)建立和管理筆記本的公開 API。
- 透過 Job Scheduler API 執行筆記本 以便按需執行,包含參數化、會話配置、環境與 Lakehouse 選擇、執行監控以及取消。
匯入現有筆記本
您可以使用工作區工具列中的選項,將一或多個現有的筆記本從本機電腦匯入。 Fabric筆記本能辨識標準的 Jupyter Notebook .ipynb 檔案,以及像 .py、.scala 和 .sql 等原始碼檔案,並相應地建立新的筆記本項目。
匯出筆記本
您可以將筆記本匯出為其他標準格式。 Fabric 筆記本可匯出為:
儲存筆記本
在 Fabric 中,筆記本預設會在你開啟並編輯後自動儲存;你不必擔心程式碼變更會遺失。 您也可以使用儲存複本來在目前的工作區製作另一個複本,或在其他工作區製作複本。
如果您想手動儲存筆記本,您可以切換到手動儲存選項,以建立筆記本項目的本機分支,然後使用儲存或CTRL+s來儲存您的變更。
您也可以選取編輯 -> 儲存選項 -> 手動 來切換至手動儲存模式。 若要開啟筆記本的本機分支,然後手動儲存,請選取儲存或使用 Ctrl+s 鍵盤捷徑。
連接 Lakehouse 和筆記本
Fabric 筆記本現在支援與湖屋的密切互動;您可以輕鬆地從湖屋瀏覽器中新增新的或現有的湖屋。
您可以在 Lakehouse Explorer 中巡覽至不同的 lakehouse,並將一個 lakehouse 釘選為預設。 接著,您的預設值會掛載到執行階段的工作目錄,並且您可以利用本機路徑讀取或寫入預設的 Lakehouse。
注意
您必須在釘選新的 Lakehouse 後或重新命名預設的 Lakehouse 後,重新啟動工作階段。
新增或移除湖屋
選取湖泊倉庫名稱旁邊的X圖示,會將它從筆記本索引標籤中移除,但湖泊倉庫項目仍然存在於工作區中。
選取新增 Lakehouse 以將更多 Lakehouse 新增至筆記本,方法是新增現有的 lakehouse 或建立新的 Lakehouse。
探索 Lakehouse 文件
Lake 視圖的Tables和Files區段下的子資料夾和檔案會出現在Lakehouse列表與筆記本內容之間的內容區域中。 在 資料表 和 檔案區段中選取不同的資料夾,以重新整理內容區域。
資料夾和檔案操作
如果您以滑鼠右鍵選取檔案(.csv、.parquet、.txt、.jpg、.png等),您可以使用 Spark 或 Pandas API 來載入資料。 新的程式碼儲存格會產生並插入焦點儲存格下方。
您可以從選取的檔案或資料夾,輕鬆地複製具有不同格式的路徑,並在程式碼中使用對應的路徑。
筆記本資源
Notebook 資源總管提供類似 Unix 的文件系統,可協助您管理資料夾和檔案。 它提供可寫入的檔案系統空間,您可以在其中儲存小型檔案,例如程式碼模組、語意模型和影像。 你可以用筆記本裡的程式碼輕鬆access它們,就像你在處理本地檔案系統一樣。
注意
- 內建資料夾和環境資料夾的資源儲存體上限為 500 MB,單一檔案大小上限為 100 MB。 它們總共允許最多 100 個檔案/資料夾實例。
- 使用
notebookutils.notebook.run()時,請使用notebookutils.nbResPath指令來訪問目標筆記本資源。 相對路徑 builtin/ 將始終指向根筆記本的內建資料夾。
注意
資源資料夾中的檔案(內建與環境)及透過內嵌指令(如 %pip install 或 install.packages())安裝的函式庫,皆被限定為當前筆記本會話。 不論環境發佈在快速模式或完整模式下,他們都不會受到影響。
內建資源資料夾
內建 resources 資料夾是每個筆記本唯一的系統定義資料夾。 建議使用內建的資源資料夾來儲存目前筆記本中使用的所有資料。 以下是筆記本資源的重要功能。
- 您可以使用一般作業,例如建立/刪除、上傳/下載、拖放、重新命名、重複,以及透過UI搜尋。
- 您可以使用相對路徑,例如
builtin/YourData.txt快速探索。 方法notebookutils.nbResPath可協助您撰寫完整路徑。 - 您可以透過「寫入至 Lakehouse」選項,輕鬆地將已驗證的資料移至 Lakehouse。 Fabric 嵌入了常見檔案類型的豐富程式碼片段,幫助你快速上手。
- 這些資源也可在參考筆記本執行
案例中使用 。
環境資源資料夾
環境資源資料夾是一個共用存放庫,其設計目的是簡化跨多個筆記本的共同作業。
您可以在環境中找到 [ 資源 ] 索引標籤,並擁有完整的作業來管理這裡的資源檔。 一旦筆記本連結至目前環境,這些檔案就可以跨多個筆記本共用。
在 [Notebook] 頁面中,您可以輕鬆地在 [從附加環境繼承的資源] 下找到第二個根資料夾。
您也可以在與內建資源資料夾相同的檔案/資料夾上操作。
環境資源路徑會自動掛接至筆記本叢集。 你可以用相對路徑/env來存取環境資源。
Fabric 環境支援兩種函式庫發佈模式,這些模式會影響函式庫如何交付至您的筆記本工作階段:
- 快速模式 大約 5 秒就能發佈,並在筆記本工作開始時安裝函式庫。 快速模式可以覆寫透過完整模式發佈的函式庫版本,但僅限於當前會話。
- 全模式 會建立穩定且可重現的函式庫快照。 發佈通常需要 3 到 6 分鐘,啟動會話則會增加 1 到 3 分鐘以完成相依部署。 使用完整模式搭配 自訂的活池 ,可以將會話開始時間回到約 5 秒,同時維持快照的穩定。
關於每種模式的詳細資訊,請參見 管理Fabric環境中的函式庫。
在筆記本中使用環境函式庫
根據您的工作流程選擇圖書館出版模式:
- 快速模式用於迭代開發:當你在筆記本中積極實驗並需要快速函式庫迭代時,使用快速模式。 函式庫在會話開始時安裝,發佈時間極短。
- 完整模式以提升重現性:當你需要在協作者間保持一致的函式庫版本、排程執行或管線工作時,請使用全模式。 快照確保每個會話開始時都具有相同的依賴項。
- 全模式搭配自訂即時池以實現快速且穩定的會話:當快速會話啟動與可重現性都很重要時,請設定完整模式並搭配 自訂即時池。 此組合可在大約 5 秒內啟動會話,並同時保留穩定的函式庫快照。
注意
具有相對路徑的讀取/寫入無法在 高並行會話中運作。
檔案編輯器
檔案編輯器可讓您直接在筆記本的資源資料夾和環境資源資料夾中檢視和編輯檔案。 支援的檔類型包括 CSV、TXT、HTML、YML、PY、SQL 等。 透過檔案編輯器,您可以輕鬆access與修改筆記本內的檔案,支援關鍵字高亮,並在開啟及編輯程式碼檔案如
你可以透過檔案選單中的'檢視與編輯'來access此功能。 雙擊檔案是較快的方式。
若要手動儲存檔案編輯器中的內容變更,請按一下儲存 按鈕或使用鍵盤快捷方式 Ctrl+S,檔案編輯器不支援自動儲存。
筆記本模式 也會影響檔案編輯器。 如果您處於筆記本模式,而不需要編輯許可權,您只能檢視檔案,但無法編輯這些檔案。
注意
以下是檔案編輯器的一些限制。
- 檔案大小限制為 1 MB。
- 檢視和編輯不支援這些文件類型: .xlsx 和 .parquet。
在筆記本中共同作業
Fabric 筆記本是一個協作裝置,支援多位使用者編輯同一本筆記本。
當您開啟筆記本時,預設會進入共同編輯模式,而且會自動儲存每個筆記本編輯。 如果您的同事同時開啟相同的筆記本,您會看到其個人資料、程式執行結果、游標指標、選取指標,以及編輯追蹤。 藉由使用共同作業功能,您可以輕鬆地完成配對程式設計、遠端偵錯和輔導案例。
在筆記本中使用 Copilot
Copilot 能立即掌握工作區、附加的 Lakehouse 架構、資料表與檔案、筆記本結構,以及當前執行狀態。 你不需要先開始一場會話,Copilot 就能開始協助你。 Copilot 支援多步驟、全筆記本的程式碼產生、重構、摘要與驗證,跨整個工作流程,讓你能跨儲存格工作而不失去上下文。
來自 Copilot 的效能洞察
Copilot 會根據資料大小、連接模式及執行時行為呈現效能指引。 例如,它能建議高效的連接策略,幫助你避免昂貴的洗牌,建議重構為可重用函式,並指出執行過程中觀察到的潛在資料品質問題。 這些洞見會出現在你的Copilot對話中,並與 /optimize 指令相符。
使用 Copilot 進行故障排除
當儲存格或 Spark 作業失敗時,失敗的儲存格下方會出現一個使用 Copilot 修復選項。 它提供錯誤摘要、根本原因分析及建議的修正方法。 Copilot 可以自動套用程式碼變更並附上批准差異,讓你在提交前可以先檢視。 你也可以在Copilot聊天中使用 /fix 指令,針對特定儲存格或整個筆記本執行針對性診斷。 更多資訊請參閱使用 Copilot 診斷筆記本故障。
共用筆記本
共用筆記本是與小組成員共同作業的便利方式。 根據預設,授權的工作區角色可以檢視或編輯/執行筆記本。 您可以使用已授與的指定許可權來共享筆記本。
在筆記本工具列上選擇共用。
選取可檢視此筆記本的人員對應的類別。 您可以選擇 收件者的共享、編輯 或執行許可權。
選取 套用 之後,您可以直接傳送筆記本,或將連結複製到其他人。 收件者接著可以使用其許可權等級授與的對應檢視來開啟筆記本。
若要進一步管理筆記本許可權,請選取工作區項目清單>更多選項,然後選取管理許可權。 從那個畫面,你可以更新現有筆記本的 access 和權限。
為程式碼儲存格加上批注
批注是共同作業案例的另一個實用功能。 目前,Fabric 支援新增單元級註解。
選擇筆記本工具列上的註解按鈕或儲存格註解指示器,以開啟註解窗格。
在程式碼儲存格中選取程式碼,按一下註解 窗格中的新增,然後按一下張貼註解 按鈕來儲存。
如有需要,請選取批注旁的更多 選項,尋找編輯批注、解決線程 和刪除線程選項。
在註解中標記其他人
「標記」是指在註解線程中提及並通知使用者,以有效率地加強特定項目的共同作業。
選取儲存格中的程式碼區段,並新增批注線程。
輸入使用者名稱,如果您想在有關某個部分的討論中提及某人,請從建議清單中選擇正確的使用者名稱。
分享您的見解並張貼。
當觸發電子郵件通知時,用戶點擊 [開啟批注] 連結,以快速找到此儲存格。
此外,當標記沒有 access 的人時,請授權並設定使用者權限,確保你的程式碼資產能妥善管理。
注意
針對批註項目,如果在一小時內更新批註,標記的使用者將不會收到電子郵件通知。 但它會將電子郵件通知傳送給新的已標記使用者。
版本歷程記錄
這很重要
這項功能目前處於預覽階段。
版本歷程記錄可讓您輕鬆地設定即時筆記本變更的版本。 它支援具有強固內建版本控制功能的歷程記錄追蹤和筆記本管理,這特別有助於在相同筆記本上與多個參與者共同作業。
Access版本 history,來自 Notebook Global 工具列。
Notebook 支援兩種方式來建立檢查點。
筆記本多源檢查點
Fabric 筆記本能無縫整合 Git、部署管線及 Visual Studio Code。 每個儲存的版本都會自動被記錄在筆記本的版本歷史中。 版本可能來自筆記本內的直接編輯、Git 同步、部署流程活動,或透過 VS Code 發佈。 每個版本的來源在版本歷史中都會清楚標示,以確保完整的可追溯性。
您可以按下檢查點來開啟 差異檢視,它會醒目提示選取的檢查點與目前即時版本之間的內容差異,包括數據格內容、單元格輸出和元數據的差異。 您可以在 [更多選項] 功能表中個別管理此檢查點的版本。
你可以從檢查點下拉選單管理版本,如果想保留舊版本,可以從檢查點點 還原 並覆寫目前筆記本,或用 另存為複製 複製到新筆記本。
注意
筆記本模式切換器
Fabric筆記型電腦支援四種模式,可切換:Develop、僅運行、Edit,以及 View。 每種模式都對應一組權限。
當你分享筆記本時,你會指派使用者權限。 根據這些權限,使用者可以存取並切換可用的模式。
- 開發模式:需要讀取、執行和寫入權限。
- 僅執行模式:需讀取與執行權限。
- 編輯模式:需要讀取和寫入權限(無法執行)。
- 檢視模式:需要讀取權限。
權限與存取
權限可在 Microsoft Fabric 工作區或筆記本層級設定。 它們決定使用者可存取的模式:
- 權限限制了可用模式的數量。
- 它們不會自動為使用者選擇模式。
- 模式無法賦予權限允許以外的能力。