使用數據管線將數據內嵌至倉儲
適用於: Microsoft Fabric 中的倉儲
數據管線可讓您透過圖形用戶介面使用 COPY 命令。 數據管線是活動邏輯群組,一起執行數據擷取工作。 管線可讓您管理擷取、轉換和載入 (ETL) 活動,而不是個別管理每個活動。
在本教學課程中,您將建立新的管線,以將範例數據載入 Microsoft Fabric 中的倉儲。
注意
來自 Azure Data Factory 的某些功能無法在 Microsoft Fabric 中使用,但概念是可互換的。 您可以在 Azure Data Factory 和 Azure Synapse Analytics 中深入瞭解管線和活動上的 Azure Data Factory 和管線。 如需快速入門,請流覽 快速入門:建立第一個管線以複製數據。
建立數據管線
若要建立新的管線,請選取 [+新增] 按鈕,然後選取 [數據管線]。
在 [ 新增管線] 對話框中,提供新管線 的名稱,然後選取 [ 建立]。
您將登陸管線畫布區域,其中您會看到三個選項可開始使用: 新增管線活動、 複製數據,以及 選擇要啟動的工作。
每個選項都提供不同的替代方案來建立管線:
- 新增管線活動:此選項會啟動管線編輯器,您可以使用管線活動從頭開始建立新的管線。
- 複製數據:此選項會啟動逐步助理,協助您選取數據源、目的地,以及設定數據載入選項,例如數據行對應。 完成後,它會建立新的管線活動,並 已為您設定複製數據 工作。
- 選擇要啟動的工作:此選項會啟動一組預先定義的範本,以協助您根據不同的案例開始使用管線。
選擇 [ 複製資料] 選項以啟動 複製小幫手。
複製數據助理的第一頁可協助您從各種數據源挑選自己的數據,或從其中一個提供的範例中選取以開始使用。 在本教學課程中,我們將使用 COVID-19 Data Lake 範例。 選取此選項,然後選取 [ 下一步]。
在下一個頁面中,您可以選取數據集、來源檔格式,以及預覽選取的數據集。 選取 Bing COVID-19、 CSV 格式,然後選取 [ 下一步]。
下一頁 的數據目的地可讓您設定目的地工作區的類型。 我們會將數據載入工作區中的倉儲,因此請選取 [倉儲 ] 索引卷標和 [ 數據倉儲 ] 選項。 選取 [下一步]。
現在是時候挑選要載入數據的倉儲了。 在下拉式清單中選取所需的倉儲,然後選取 [ 下一步]。
設定目的地的最後一個步驟是提供目的地數據表的名稱,並設定數據行對應。 在這裡,您可以選擇將資料載入新資料表或現有數據表、提供架構和數據表名稱、變更數據行名稱、移除資料行,或變更其對應。 您可以接受預設值,或將設定調整為喜好設定。
當您完成檢閱選項時,請選取 [ 下一步]。
下一頁可讓您選擇使用暫存,或提供數據複製作業的進階選項(使用 T-SQL COPY 命令)。 檢閱選項而不變更它們,然後選取 [ 下一步]。
助理中的最後一頁提供複製活動的摘要。 選取 [立即啟動數據傳輸] 選項,然後選取 [儲存 + 執行]。
系統會將您導向至管線畫布區域,其中已為您設定新的複製數據活動。 管線開始自動執行。 您可以在 [ 輸出 ] 窗格中監視管線的狀態:
幾秒鐘之後,您的管線就會順利完成。 巡覽回您的倉儲,您可以選取數據表來預覽數據,並確認複製作業已結束。
如需在 Microsoft Fabric 中將數據擷取到倉儲的詳細資訊,請流覽:
後續步驟
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應