使用數據管線將數據內嵌至倉儲

適用於: Microsoft Fabric 中的倉儲

數據管線可讓您透過圖形用戶介面使用 COPY 命令。 數據管線是活動邏輯群組,一起執行數據擷取工作。 管線可讓您管理擷取、轉換和載入 (ETL) 活動,而不是個別管理每個活動。

在本教學課程中,您將建立新的管線,以將範例數據載入 Microsoft Fabric 中的倉儲。

注意

來自 Azure Data Factory 的某些功能無法在 Microsoft Fabric 中使用,但概念是可互換的。 您可以在 Azure Data Factory 和 Azure Synapse Analytics 中深入瞭解管線和活動上的 Azure Data Factory 和管線。 如需快速入門,請流覽 快速入門:建立第一個管線以複製數據

建立數據管線

  1. 若要建立新的管線,請選取 [+新增] 按鈕,然後選取 [數據管線]。 使用者工作區頂端區段的螢幕快照,其中顯示 [新增] 按鈕,以及 [倉儲]、[數據管線] 和 [全部顯示] 選項。

  2. 在 [ 新增管線] 對話框中,提供新管線 的名稱,然後選取 [ 建立]。

  3. 您將登陸管線畫布區域,其中您會看到三個選項可開始使用: 新增管線活動複製數據,以及 選擇要啟動的工作。

    顯示三個選項的螢幕快照,其中顯示要選取以開始擷取的選項。

    每個選項都提供不同的替代方案來建立管線:

    • 新增管線活動:此選項會啟動管線編輯器,您可以使用管線活動從頭開始建立新的管線。
    • 複製數據:此選項會啟動逐步助理,協助您選取數據源、目的地,以及設定數據載入選項,例如數據行對應。 完成後,它會建立新的管線活動,並 已為您設定複製數據 工作。
    • 選擇要啟動的工作:此選項會啟動一組預先定義的範本,以協助您根據不同的案例開始使用管線。

    選擇 [ 複製資料] 選項以啟動 複製小幫手

  4. 複製數據助理的第一頁可協助您從各種數據源挑選自己的數據,或從其中一個提供的範例中選取以開始使用。 在本教學課程中,我們將使用 COVID-19 Data Lake 範例。 選取此選項,然後選取 [ 下一步]。

    顯示使用範例數據或其他數據源選項的螢幕快照。

  5. 在下一個頁面中,您可以選取數據集、來源檔格式,以及預覽選取的數據集。 選取 Bing COVID-19CSV 格式,然後選取 [ 下一步]。

    此螢幕快照顯示 COVID-19 範例、檔案格式和網格線的不同數據集選項,其中顯示數據的預覽。

  6. 下一頁 的數據目的地可讓您設定目的地工作區的類型。 我們會將數據載入工作區中的倉儲,因此請選取 [倉儲 ] 索引卷標和 [ 數據倉儲 ] 選項。 選取 [下一步]。

    顯示不同目的地選項的螢幕快照。

  7. 現在是時候挑選要載入數據的倉儲了。 在下拉式清單中選取所需的倉儲,然後選取 [ 下一步]。

    顯示已選取倉儲之下拉式清單的螢幕快照。

  8. 設定目的地的最後一個步驟是提供目的地數據表的名稱,並設定數據行對應。 在這裡,您可以選擇將資料載入新資料表或現有數據表、提供架構和數據表名稱、變更數據行名稱、移除資料行,或變更其對應。 您可以接受預設值,或將設定調整為喜好設定。

    顯示將數據載入現有數據表或建立新數據表的選項螢幕快照。

    當您完成檢閱選項時,請選取 [ 下一步]。

  9. 下一頁可讓您選擇使用暫存,或提供數據複製作業的進階選項(使用 T-SQL COPY 命令)。 檢閱選項而不變更它們,然後選取 [ 下一步]。

  10. 助理中的最後一頁提供複製活動的摘要。 選取 [立即啟動數據傳輸] 選項,然後選取 [儲存 + 執行]。

    此螢幕快照顯示立即啟動資料傳輸作業的選項,以及 [上一頁] 和 [儲存 + 執行] 按鈕。

  11. 系統會將您導向至管線畫布區域,其中已為您設定新的複製數據活動。 管線開始自動執行。 您可以在 [ 輸出 ] 窗格中監視管線的狀態:

    此螢幕快照顯示中央有 複製活動 的管線畫布,以及顯示目前狀態進行中的管線執行狀態。

  12. 幾秒鐘之後,您的管線就會順利完成。 巡覽回您的倉儲,您可以選取數據表來預覽數據,並確認複製作業已結束。

    此螢幕快照顯示已選取bing_covid_19數據表的倉儲,以及顯示數據表中數據預覽的方格。

如需在 Microsoft Fabric 中將數據擷取到倉儲的詳細資訊,請流覽:

後續步驟