共用方式為


什麼是資料流 Gen2?

資料流程是一種雲端工具,幫助你在不寫程式碼的情況下準備和轉換資料。 它們提供低程式碼介面,可從數百個資料來源擷取資料、使用 300+ 資料轉換轉換資料,以及將產生的資料載入多個目的地。 將它們視為您的個人數據助手,可以連接到數百個不同的數據源,清理混亂的數據,並將其準確地傳遞到您需要的地方。 無論您是公民還是專業開發者,Dataflow 都能讓您擁有現代化的資料整合體驗,從豐富的資料來源中擷取、準備並轉換資料,包括資料庫、data warehouse、Lakehouse、即時資料等。

資料流程 Gen2 是較新、功能更強大的版本,可與原始 Power BI 資料流程 (現在稱為 Gen1) 搭配使用。 Dataflow Gen2 採用了 Excel、Power BI、Power Platform 和 Dynamics 365 等多款Microsoft產品與服務中常見的 Power Query 體驗,提供更強大的功能、更佳的效能與快速的複製能力,以快速匯入與轉換資料。 如果您重新開始,我們建議您使用 Dataflow Gen2,因為它具有增強的功能和更好的效能。

您可以使用資料流程執行哪些動作?

使用資料流程,您可以:

  • 連接到您的數據: 從數據庫、文件、網絡服務等中提取信息。 你也可以重新連接最近使用的來源。
  • 轉換您的數據: 使用視覺界面清理、過濾、組合和重塑您的數據。
  • 隨處載入資料:將轉換後的資料傳送到資料庫、資料倉儲或雲端儲存。
  • 自動化流程:設置時間表,使您的數據保持新鮮並不斷更新 up-to。

資料流程功能

以下是資料流程 Gen2 和 Gen1 之間可用的功能:

功能 數據流 Gen2 數據流 Gen1
使用 Power Query 建立資料流
更簡單的創建過程
自動儲存和背景發佈
多個輸出目的地
更好的監控和刷新追蹤
與 pipelines 合作
高效能運算
透過資料流連接器連線
使用資料流連接器進行直接查詢
僅重新整理已變更的資料
AI 驅動的見解
最近資料捷徑至先前使用過的來源

升級至 Dataflow Gen2

下一節是資料流程 Gen2 相較於 Gen1 的一些重要改善,可讓您的資料準備工作更輕鬆、更有效率。

Gen2 更容易建立和使用

如果你之前用過 Power Query,Dataflow Gen2 會讓人覺得很熟悉。 我們簡化了流程,讓您更快地啟動和運行。 將資料放入資料流程時,系統會逐步引導您,而且我們已減少建立資料流程所需的步驟數目。

資料流程中整體編輯體驗的螢幕截圖。

自動儲存可確保您的工作安全

Dataflow Gen2 會在您工作時自動儲存您的變更。 您可以離開電腦、關閉瀏覽器或失去網路連接,而不必擔心遺失進度。 當你回來時,一切都保持在你離開時的地方。

完成建置資料流程之後,您可以發佈變更。 發佈會儲存您的工作並執行背景檢查,因此您不必等待所有內容通過檢查,然后才能繼續下一個任務。

若要深入瞭解儲存的運作方式,請查看 儲存資料流的草稿.

將資料傳送到任何需要的地方

Dataflow Gen1 將轉換後的資料儲存在自己的內部storage(可透過 Dataflow 連接器access),而 Dataflow Gen2 則提供你使用該storage或將資料傳送到不同目的地的彈性。

這種靈活性開闢了新的可能性。 例如,您可以:

  • 使用資料流程將資料載入湖倉,然後使用筆記本工具進行分析
  • 將資料載入 Azure SQL database,然後使用管線將其移至 data warehouse

資料流程 Gen2 目前支援下列目的地:

  • Azure SQL 資料庫
  • Azure Data Explorer (Kusto)
  • Azure Datalake Gen2 (preview)
  • Fabric Lakehouse 資料表
  • Fabric Lakehouse 檔案(預覽)
  • 布料倉庫
  • Fabric KQL 資料庫
  • 網狀架構 SQL 資料庫
  • SharePoint 檔案

螢幕擷取畫面,其中顯示支援資料的目的地。

如需可用資料目的地的詳細資訊,請參閱資料流程 Gen2 資料目的地和管理設定。

更好的監控和刷新追蹤

資料流程 Gen2 可讓您更清楚瞭解資料重新整理所發生的情況。 我們已與 監視中心 整合,並改善 重新整理歷程記錄 體驗,讓您可以追蹤資料流程的狀態和效能。

螢幕擷取畫面,其中顯示重新整理狀態的詳細資料。

與資料管道無縫搭配

Pipelines 讓你可以將活動分組完成較大的任務。 將它們視為可以複製資料、執行 SQL 查詢、執行預存程序或執行 Python 筆記本的工作流程。

您可以連接管線中的多個活動,並將其設定為依排程執行。 舉例來說,每週一你可能會用管線從 Azure 的 blob 抓取資料並清理,然後觸發 Dataflow Gen2 來分析日誌資料。 或者月底時,你可以把資料從 Azure 的 blob 複製到 Azure SQL database,然後在該資料庫上執行儲存程序。

截圖顯示與流水線的整合。

欲了解更多如何將資料流與pipelines連結,請參閱 dataflow activities

高效能運算

資料流程 Gen2 會使用進階計算 Fabric SQL 計算引擎來有效率地處理大量資料。 為了讓這件事運作,Dataflow Gen2 會在使用者的工作區建立 Lakehouse 和 Warehouse 項目,並用它們來儲存和存取資料,提升資料流的整體效能。

尋找並重用近期資料來源

Dataflow Gen2 包含一個 「近期資料 模組」,可記錄你先前使用的項目——如表格、檔案、資料夾、資料庫和工作表——並讓你能直接將其載入 Dataflow Gen2 編輯畫布中。 你可以從 Power Query 功能區或現代化的 Get Data 體驗中存取最近資料,這樣你就能快速找到需要的資料,無需重新設定連線。

從任何「最近資料」輸入中,你也可以選擇「 瀏覽位置 」來探索並選擇同一資料夾或資料庫內的其他相關項目,方便在同一地點處理多個資源。

適用於資料流程 Gen2 的 Copilot

Dataflow Gen2 在 Fabric 中整合 Microsoft Copilot,提供 AI 驅動的協助,利用自然語言提示來建立資料整合解決方案。 Copilot 可讓您使用交談語言來執行資料轉換和作業,以協助您簡化資料流程開發程式。

  • 從來源獲取數據: 使用 'Get data from' 入門提示連接到各種數據源,如 OData、數據庫和文件
  • 使用自然語言轉換數據: 使用對話提示應用轉換,例如:
    • “只留住歐洲客戶”
    • 「按城市統計員工總數」
    • 「只保留數量高於中位數的訂單」
  • Create sample data:使用 OpenAI Azure產生樣本資料以供測試與開發
  • 撤消操作: 鍵入或選擇“撤消”以刪除最後應用的步驟
  • 驗證和檢閱:每個 Copilot 動作都會顯示為回應卡片,並在 [套用的步驟] 清單中顯示對應的步驟

如需詳細資訊,請參閱 Copilot for Dataflow Gen2

使用資料流需要哪些條件?

Dataflow Gen2 需要 Fabric 容量、Fabric 試用容量或 Power BI Premium 容量。 要了解資料流授權的運作方式,可以參考 Microsoft Fabric 概念與授權

從資料流程第 1 代 (Gen1) 移至第 2 代 (Gen2)

如果您已經有使用 Gen1 建置的數據流,請不要擔心,您可以輕鬆地將它們移轉至 Gen2。 我們有幾個選項可以幫助您進行轉換:

匯出和匯入您的查詢

您可以匯出資料流Gen1查詢並將其儲存至PQT檔案,然後將其匯入資料流Gen2。 如需逐步指示,請參閱 使用匯出範本功能

在 Power Query 中複製並貼上

如果您在 Power BI 或 Power Apps 中有資料流程,您可以複製查詢並將其貼到資料流程 Gen2 編輯器中。 此方法可讓您移轉,而不需要從頭開始重建查詢。 深入了解: 複製並貼上現有的資料流程 Gen1 查詢

使用另存新檔功能

如果您已經擁有任何類型的資料流(Gen1、Gen2 或 Gen2 CI/CD),Data Factory 現在新增了「另存新檔」功能。 這可讓您將任何現有的資料流儲存為新的資料流Gen2 (CI/CD)專案,只需一個動作。 詳細資訊:使用另存為遷移至 Dataflow Gen2 (CI/CD)。

準備好進行深入了解嗎? 查看這些有用的資源: