什麼是資料流程?

提示

在 Microsoft Fabric 的 Data Factory 中試用 DataFlow Gen2,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從數據移動到數據科學、即時分析、商業智慧和報告等所有專案。 瞭解如何 免費啟動新的試用版

數據流是自助、雲端式、數據準備技術。 數據流可讓客戶將數據內嵌、轉換及載入 Microsoft Dataverse 環境、Power BI 工作區或您組織的 Azure Data Lake 儲存體 帳戶。 數據流是使用Power Query所撰寫,這是許多Microsoft產品中已具備的統一數據連線和準備體驗,包括Excel和Power BI。 客戶可以觸發數據流,視需要或自動依排程執行;數據一律保持在最新狀態。

數據流可以在多個 Microsoft 產品中建立

數據流在多個 Microsoft 產品中都有特色,不需要建立或執行數據流特定的授權。 數據流可在 Power Apps、Power BI 和 Dynamics 365 Customer Insights 中使用。 建立和執行數據流的能力會與這些產品的授權配套。 數據流功能最常出現在其功能的所有產品中,但某些產品特定功能可能存在於一個產品與另一個產品中建立的數據流中。

數據流如何運作?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

上圖顯示如何定義數據流的整體檢視。 數據流會從不同的數據源取得數據(已經支持超過80個數據源)。 然後,根據使用Power Query撰寫體驗所設定的轉換,數據流會使用數據流引擎來轉換數據。 最後,數據會載入輸出目的地,可以是 Microsoft Power Platform 環境、Power BI 工作區或組織的 Azure Data Lake 儲存體 帳戶。

數據流在雲端中執行

數據流是以雲端為基礎。 撰寫並儲存數據流時,其定義會儲存在雲端中。 數據流也會在雲端中執行。 不過,如果數據源是內部部署,內部部署數據閘道可用來將數據擷取至雲端。 觸發數據流執行時,數據轉換和計算會在雲端中發生,而目的地一律在雲端中。

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

數據流使用功能強大的轉換引擎

Power Query 是數據流中使用的數據轉換引擎。 此引擎足以支援許多進階轉換。 它也會使用直接且功能強大的圖形使用者介面,稱為 Power Query 編輯器。 您可以搭配此編輯器使用數據流,更快速地開發數據整合解決方案。

Screenshot showing an example of Power Query transformations.

數據流與 Microsoft Power Platform 和 Dynamics 365 整合

因為數據流會將產生的數據表儲存在雲端式記憶體中,其他服務可以與數據流所產生的數據互動。

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

例如,Power BI、Power Apps、Power Automate、Power Virtual Agents 和 Dynamics 365 應用程式可以連線到 Dataverse、Power Platform 數據流連接器,或直接透過 Lake 取得數據流所產生的數據,視數據流建立時間設定的目的地而定。

數據流的優點

下列清單會醒目提示使用資料流的一些優點:

  • 數據流會將數據轉換層與Power BI解決方案中的模型化和視覺效果層分離。

  • 數據轉換程式代碼可以位於中央位置、數據流,而不是分散到多個成品之間。

  • 數據流建立者只需要 Power Query 技能。 在具有多個建立者的環境中,數據流建立者可以是組建整個 BI 解決方案或操作應用程式的小組的一部分。

  • 數據流與產品無關。 它不是 Power BI 的元件;您可以在其他工具和服務中取得其數據。

  • 數據流利用Power Query,這是功能強大的圖形化自助數據轉換體驗。

  • 數據流會在雲端中完全執行。 不需要額外的基礎結構。

  • 您可以使用Power Apps、Power BI和 Customer Insights 的授權,開始使用數據流的多個選項。

  • 雖然數據流能夠進行進階轉換,但專為自助案例所設計,且不需要IT或開發人員背景。

數據流的使用案例

您可以針對許多用途使用數據流。 下列案例提供一些數據流常見使用案例的範例。

從舊版系統移轉數據

在此案例中,組織已決定使用Power Apps來取得新的使用者介面體驗,而不是舊版內部部署系統。 Power Apps、Power Automate 和 AI Builder 全都使用 Dataverse 作為主要數據儲存系統。 現有的內部部署系統中目前的數據可以使用數據流移轉至 Dataverse,然後這些產品就可以使用該數據。

使用數據流建置數據倉儲

您可以使用資料流來取代其他擷取、轉換、載入 (ETL) 工具來建置數據倉儲。 在此案例中,公司的數據工程師決定使用數據流來建置其星型架構設計的數據倉儲,包括Data Lake 儲存體中的事實和維度數據表。 接著,Power BI 會藉由從數據流取得數據來產生報表和儀錶板。

Image of how to build a data warehouse using dataflows.

使用數據流來建置維度模型

您可以使用數據流作為其他 ETL 工具的替代專案,以建置維度模型。 例如,公司的數據工程師決定使用數據流來建置星型架構設計維度模型,包括 Azure Data Lake 儲存體 Gen2 中的事實和維度數據表。 接著,Power BI 會藉由從數據流取得數據來產生報表和儀錶板。

Image of how to build a dimensional model using dataflows.

集中處理多個 Power BI 解決方案的數據準備和重複使用語意模型

如果多個 Power BI 解決方案使用相同的數據表轉換版本,則建立數據表的程式將會重複多次。 這會增加來源系統上的負載、耗用更多資源,以及建立具有多個失敗點的重複數據。 相反地,可以建立單一數據流來計算所有解決方案的數據。 接著,Power BI 就可以在所有解決方案中重複使用轉換的結果。 數據流,如果以此方式使用,可以是強固的 Power BI 實作架構的一部分,可避免 Power Query 程式代碼重複,並減少數據整合層的維護成本。

Image of how tables can be reused across multiple solutions.

下一步

下列文章提供數據流的進一步研究數據。