什麼是 Microsoft Fabric 中的 Data Factory?

Data Factory 可讓您擁有現代化數據整合體驗,從一組豐富的數據源內嵌、準備和轉換數據(例如資料庫、數據倉儲、Lakehouse、實時數據等等)。 無論您是公民或專業開發人員,您都可以使用智慧型手機轉換來轉換數據,並利用一組豐富的活動。 透過 Microsoft Fabric 中的 Data Factory,我們將快速複製(數據移動)功能帶入數據流和數據管線。 使用快速複製,您可以在最愛的數據存放區之間移動數據。 最重要的是,快速複製可讓您將數據帶入 Microsoft Fabric 中的 Lakehouse 和數據倉儲,以進行分析。

Data Factory 會實作兩個主要的高階功能:數據流和管線。

  • 數據流可讓您在數據流設計工具中運用 300 多個轉換,讓您比任何其他工具更輕鬆且更有彈性地轉換數據,包括智慧型手機 AI 資料轉換。
  • 數據管線可讓您利用現用豐富的數據協調流程功能,撰寫符合您企業需求的彈性數據工作流程。

資料流程

數據流提供低程式代碼介面,可讓您從數百個數據源擷取數據,使用300個以上的資料轉換來轉換您的數據。 接著,您可以將產生的數據載入多個目的地,例如 Azure SQL 資料庫等等。 數據流可以使用手動或排程的重新整理,或作為數據管線協調流程的一部分重複執行。

數據流是使用熟悉 的Power Query 體驗所建置,目前可在數個 Microsoft 產品和服務中使用,例如 Excel、Power BI、Power Platform、Dynamics 365 Insights 應用程式等等。 Power Query 可讓所有使用者,從公民到專業數據整合器,跨其數據資產執行數據擷取和數據轉換。 從易於使用、高度可視化、低程式代碼 UI 執行聯結、匯總、數據清理、自定義轉換等等。

Screenshot of the Power BI user interface showing the dataflow experience.

資料管線

數據管線在雲端規模上啟用強大的工作流程功能。 透過數據管線,您可以建置複雜的工作流程,以重新整理數據流、移動 PB 大小數據,以及定義複雜的控制流程管線。

使用數據管線來建置複雜的 ETL 和數據處理站工作流程,以大規模執行許多不同的工作。 控制流程功能內建於數據管線中,可讓您建置工作流程邏輯,以提供迴圈和條件。

在端對端 ETL 資料管線的單一管線中,將組態驅動複製活動與您的低程式代碼數據流重新整理一起新增。 您甚至可以新增 Spark Notebook、SQL 腳本、預存程式等等的程式代碼優先活動。

Screenshot of the user interface showing copy activity.

若要開始使用 Microsoft Fabric,請移至 快速入門:建立您的第一個數據流 Gen2 以取得和轉換數據