在本教學課程中,我們會提供針對常見案例的端對端步驟,即使用管線以高效能複製的方式將來源資料載入 Lakehouse,然後透過資料流程轉換資料,讓使用者可以輕鬆地載入和轉換資料。
必要條件
已啟用 Microsoft Fabric 的工作區。 如果您還沒有工作區,請參閱建立工作區一文。
建立管線
切換至 Data Factory 體驗。
選取 新增 ,然後選取 管線,然後輸入管線的名稱。
使用管線將範例資料載入至 Lakehouse
使用下列步驟將範例資料載入至 Lakehouse。
步驟 1:從「Copy 助手」開始
選取畫布上的 [複製資料助理],以開啟 [複製助理] 工具即可開始使用。 或者,從緞帶的 [活動]
步驟 2:設定來源
從資料來源的 [範例資料] 選項中選擇 [國定假日],然後選取 [下一步]。
在 [複製資料] 助理的 [連線至資料來源] 區段中,會顯示範例資料的預覽。 選取 [下一步] 以移動到資料目的地。
步驟 3:設定目的地
選擇 Lakehouse。
輸入 LHDemo 作為 Lakehouse 名稱,然後選取 [ 建立並連線]。
設定來源資料並將其對應到目標 Lakehouse 資料表。 選取 [表格] 以適用於 [根資料夾],並為 [載入設定] 選取 [載入至新表格]。 提供資料表名稱,然後選取 [下一步]。
步驟 4:檢閱並建立複製活動
檢閱先前步驟中的複製活動設定,然後選取 [立即開始資料傳輸]。 然後選取 [儲存 + 執行],以執行新的管線。
完成後,複製活動會新增至你的新管道設計畫布,並且管道會自動執行以將資料載入 Lakehouse。
您可以監視執行中的進程,並在管線畫布下方的 [輸出] 索引標籤上檢查結果。 將滑鼠停留在輸出列中的名稱上方,以看到 執行詳細資料 按鈕(已醒目提示的一副眼鏡的圖示),來檢視執行詳細資料。
運行詳細資料顯示已讀取和寫入 69,557 個資料列,以及運行的各種其他詳細資料,包括持續時間的細節。
使用數據流 Gen2 轉換 Lakehouse 中的數據
您現在擁有一個載入了範例資料的 Lakehouse。 接下來,您將使用資料流程來轉換資料。 資料流程是一種無需程式碼即可大規模轉換資料的方式。
選取您的工作區,然後選取 [[新增專案]>[資料流 Gen2]。
選取 [取得資料] 下拉式清單,然後選取 [更多...]。
搜尋 Lakehouse,然後選取 [Lakehouse]。
登入並選取 [下一步] 以繼續。
選取您在上一個步驟中建立的數據表,然後選取 [建立。
檢閱編輯器中的資料預覽。
將篩選套用至資料流程,限縮至只包含 Countryorregion 欄等於 比利時的資料列。
依次選取 [新增資料目的地] 和 [Microsoft Fabric 中的 Lakehouse],將資料目的地新增至查詢。
登入並選取 [下一步] 以繼續。
建立名為 BelgiumPublicHolidays 的新資料表,然後選取 [下一步]。
檢查設定,並選取 儲存設定。
選取 發佈來發佈資料流。
發佈資料流程後,選取 立即重新整理 來執行資料流程。
重新整理完成之後,您可以檢視 Lakehouse 資料表中的資料。 您現在也可以使用此資料來建立報表、儀表板等等。
相關內容
此範例展示如何使用 Microsoft Fabric 中的 Data Factory,將範例資料複製到 Lakehouse 並利用資料流程進行轉換。 您已經學會如何:
- 建立管線。
- 使用管線將範例資料載入至 Lakehouse。
- 使用資料流程來轉換 Lakehouse 中的資料。
接下來,深入瞭解如何監控您的管線執行。