共用方式為


什麼是 Microsoft Fabric 中的資料工程?

Microsoft Fabric 中的資料工程可讓使用者設計、建置和維護基礎結構與系統,讓組織能夠收集、儲存、處理和分析大量資料。

Microsoft Fabric 提供各種資料工程功能,以確保資料易於存取、組織良好而且具有高品質。 從資料工程首頁中,您可以:

  • 使用 Lakehouse 建立和管理資料

  • 設計管線以將資料複製到 Lakehouse

  • 使用 Spark 工作定義將批次/串流工作提交至 Spark 叢集

  • 使用筆記本寫入程式碼,以擷取、準備和轉換資料

    螢幕擷取畫面,其中顯示資料工程師物件。

Lakehouse

Lakehouses 是可讓組織使用各種工具和架構,在單一位置儲存和管理結構化和非結構化資料,以處理和分析該資料的資料架構。 這些工具和架構可以包含 SQL 型查詢和分析,以及機器學習和其他進階分析技術。

Apache Spark 工作定義

Spark 工作定義是一組指令,可定義如何在 Spark 叢集上執行工作。 其中包含輸入和輸出資料來源、轉換和 Spark 應用程式的組態設定等資訊。 Spark 工作定義可讓您將批次/串流工作提交至 Spark 叢集、將不同的轉換邏輯套用至 Lakehouse 上裝載的資料,以及其他許多項目。

Notebook

筆記本是互動式計算環境,可讓使用者建立及共用包含即時程式碼、方程式、視覺效果和敘事文字的文件。 筆記本允許使用者以包括 Python、R 和 Scala 在內的各種程式設計語言寫入和執行程式碼。 您可以將筆記本用於資料擷取、準備、分析和其他資料相關工作。

資料管線

資料管線是可收集、處理資料,並從資料的原始形式轉換到可用於分析和制定決策之格式的一系列步驟。 它們是資料工程的重要元件,因為它們提供一種以可靠、可調整且有效率的方式將資料從來源移至目的地的方式。

當您註冊 Fabric 試用版時,可以在 Microsoft Fabric 免費使用資料工程。 您也可以購買 Microsoft Fabric 容量Fabric 保留容量

開始使用資料工程: