Microsoft Fabric 術語
了解 Microsoft Fabric 中使用的術語定義,涵蓋 Synapse 資料倉儲、Synapse 資料工程、Synapse 資料科學、即時智慧、Data Factory 和 Power BI 等專有詞彙。
一般條款
容量:容量是一組專用的資源,可在指定時間使用。 容量會定義資源執行活動或產生輸出的能力。 不同的項目在特定時間會耗用不同的容量。 Fabric 會透過 Fabric SKU 和試用版提供容量。 如需詳細資訊,請參閱何謂容量?
體驗:專為特定功能設計的功能集合。 Fabric 體驗包括 Synapse 資料倉儲、Synapse 資料工程、Synapse 資料科學、即時智慧、Data Factory 和 Power BI。
項目:一個項目是體驗中的一組功能。 使用者可以建立、編輯及刪除項目。 每個項目類型都提供不同的功能。 例如,資料工程體驗包括 Lakehouse、筆記本和 Spark 作業定義項目。
租用戶:租用戶是組織的 Fabric 單一執行個體,且與 Microsoft Entra ID 一致。
工作區:工作區是將不同功能聚集在單一環境中的項目集合,該單一環境旨在促進協作。 它會做為容器,使用所執行之工作的容量,並提供誰可以存取其中項目的控制項。 例如,在工作區中,使用者可以建立報告、筆記本、語意模型等。如需詳細資訊,請參閱工作區一文。
Synapse 資料工程
Lakehouse:Lakehouse 是由檔案、資料夾和資料表組成的集合,代表資料湖上由 Apache Spark 引擎和 SQL 引擎用於處理大數據的資料庫。 Lakehouse 在使用開放原始碼 Delta 格式化資料表時,包含 ACID 交易的增強功能。 Lakehouse 項目託管於 Microsoft OneLake 中的一個唯一的工作區資料夾。 它包含各種格式的檔案 (結構化和非結構化),這些檔案組織在資料夾和子資料夾中。 如需詳細資訊,請參閱何謂 Lakehouse?
筆記本:Fabric 筆記本一種具有豐富函式的多語言互動式程式設計工具。 其中包括撰寫程式碼和 Markdown、執行和監視 Spark 作業、檢視和視覺化結果,以及與團隊共同作業。 它可協助資料工程師和資料科學家探索和處理資料,以及透過程式碼和低程式碼體驗建置機器學習實驗。 它可以輕鬆地轉換成協調流程的管線活動。
Spark 應用程式:Apache Spark 應用程式是由使用者使用其中一種 Spark API 語言 (Scala、Python、Spark SQL 或 Java) 或 Microsoft 新增的語言 (.NET 搭配 C# 或 F#) 撰寫的程式。 當應用程式執行時,它會拆分為一或多個平行執行的 Spark 作業,以更快處理資料。 如需詳細資訊,請參閱 Spark 應用程式監視。
Apache Spark 作業:Spark 作業是 Spark 應用程式的一部分,與應用程式中其他作業平行執行。 一項作業有多個工作組成。 如需詳細資訊,請參閱 Spark 作業監視。
Apache Spark 作業定義:Spark 作業定義是由使用者設定的一組參數,指示 Spark 應用程式應如何執行。 它讓您可以將批次或串流作業提交至 Spark 叢集。 如需詳細資訊,請參閱何謂 Apache Spark 作業定義?
V 順序:對 parquet 檔案格式的寫入最佳化,可實現快速讀取並提供經濟高效且更出色的效能。 所有 Fabric 引擎預設都會寫入 V 順序的 parquet 檔案。
Data Factory
連接器:Data Factory 提供了一組豐富的連接器,可讓您連線至不同類型的資料存放區。 連線以後,您可以對資料進行轉換。 如需詳細資訊,請參閱連接器。
資料管線:在 Data Factory 中,資料管線用於協調資料移動和轉換。 這些管線與 Fabric 中的部署管線不同。 如需詳細資訊,請參閱 Data Factory 概觀中的管線。
Dataflow Gen2:資料流程提供低程式碼介面,可從數百個資料來源擷取資料,以及對資料進行轉換。 Fabric 中的資料流程即 Dataflow Gen2。 Dataflow Gen1 存在於 Power BI 中。 相較於 Azure Data Factory 或 Power BI 中的資料流程,Dataflow Gen2 提供額外的功能。 您不能從 Gen1 升級至 Gen2。 如需詳細資訊,請參閱 Data Factory 概觀中的資料流程。
觸發程式:Data Factory 中的自動化功能,可根據特定條件 (如排程或資料可用性) 起始管線。
Synapse 資料科學
Data Wrangler:Data Wrangler 是一種筆記本型工具,可為使用者提供沉浸式體驗,以方便進行探索式資料分析。 該功能整合了方格式資料顯示、動態統計資料摘要及一組常用的資料清理操作,只需點按幾個圖示即可輕鬆使用。 每項操作都會產生可儲存回筆記本的程式碼,以作為可重複使用指令碼。
實驗:機器學習實驗是組織和控制的主要單位,用於所有相關的機器學習執行。 如需詳細資訊,請參閱 Microsoft Fabric 中的機器學習實驗。
模型:機器學習模型是已定型的檔案,可以辨識特定類型的模式。 您可以使用一組資料來將模型定型,為其提供演算法,使其可用於透過那些資料集進行推理,並從中學習。 如需詳細資訊,請參閱機器學習模型。
執行:執行會對應至模型程式碼的單一執行。 在 MLflow 中,追蹤是以實驗和執行為基礎。
Synapse 資料倉儲
SQL 分析端點:每個 Lakehouse 都有一個 SQL 分析端點,可讓使用者透過 TDS 使用 TSQL 查詢 Delta 資料表的資料。 如需詳細資訊,請參閱 SQL 分析端點。
Synapse 資料倉儲:Synapse 資料倉儲做為傳統的資料倉儲,支援您預期企業資料倉儲會提供的完整交易式 T-SQL 功能。 如需詳細資訊,請參閱 Synapse 資料倉儲。
即時智慧
KQL 資料庫:KQL 資料庫所保存資料的格式,可用來執行 KQL 查詢。 如需詳細資訊,請參閱查詢 KQL 資料庫。
KQL 查詢集:KQL 查詢集是用於執行查詢、檢視結果,以及操作來自 [資料總管] 資料庫的資料查詢結果的項目。 查詢集包含資料庫和資料表、查詢以及結果。 KQL 查詢集可讓您儲存查詢以供日後使用,或匯出查詢並與他人共用。 如需詳細資訊,請參閱在 KQL 查詢集中查詢資料
事件串流:Microsoft Fabric 事件串流功能在 Fabric 平台中提供集中位置,以擷取、轉換和路由即時事件至無程式碼體驗的目的地。 事件串流包含各種串流資料來源、擷取目的地,以及需要轉換時的事件處理器。 如需詳細資訊,請參閱 Microsoft Fabric 事件串流。
OneLake
- 捷徑:捷徑是指向其他檔案存放區位置的 OneLake 內嵌參考。 它們讓使用者可以連線到現有資料,而不需要直接進行拷貝。 如需詳細資訊,請參閱 OneLake 捷徑。