什麼是語意連結?
語意連結是一項功能,可讓您在 Microsoft Fabric 中建立語意模型與 Synapse 資料科學之間的連線。 僅在 Microsoft Fabric 中支援使用語意連結。
若是 Spark 3.4 和更高版本,使用 Fabric 時,預設執行階段可使用語意連結,而且不需要安裝。
若是 Spark 3.3 或更舊版本,或更新至最新版本的語意連結,請執行下列命令:
%pip install -U semantic-link
語意連結的主要目標為:
- 促進資料連線。
- 啟用語意資訊的傳播。
- 與資料科學家使用的既有工具無縫整合,例如筆記本。
語意連結可協助您以標準化的方式保留資料語意的相關領域知識,以加速資料分析並減少錯誤。
語意連結資料流程
語意連結資料流程從包含資料和語意資訊的語意模型開始。 語意連結會橋接 Power BI 與 Synapse 資料科學體驗之間的差距。
語意連結可讓您在 Synapse 資料科學體驗中使用 Power BI 的語意模型來執行任務,例如使用機器學習技術執行深入統計分析和預測模型化。 您可以使用 Apache Spark 將資料科學工作的輸出儲存到 OneLake,並使用 Direct Lake 將儲存的輸出內嵌至 Power BI。
Power BI 連線能力
語意模型可作為單一表格式物件模型,提供可靠的語意定義來源,例如 Power BI 量值。 語意連結會連線到下列生態系統中的語意模型,讓資料科學家可以輕鬆地在最熟悉的系統中工作。
- 透過 SemPy Python 程式庫的 Python pandas 生態系統。
- 透過 Spark 原生連接器的 Apache Spark 生態系統。 此實作支援各種語言,包括 PySpark、Spark SQL、R 及 Scala。
語意資訊的應用
資料中的語意資訊包括 Power BI 資料類別,例如地址和郵遞區號、資料表之間的關聯性,以及階層式資訊。
這些資料類別包含語意連結傳播至 Synapse 資料科學環境的中繼資料,以啟用新的體驗並維護資料譜系。
語意連結的一些範例應用程式包括:
語意連結是功能強大的工具,可讓商務分析師在完整的資料科學環境中有效地使用資料。
語意連結可藉由消除重新實作 Power BI 量值中內嵌的商務邏輯,促進資料科學家與商務分析師之間的順暢共同作業。 這種方法可確保雙方都能高效且具有生產力地運作,以最大化其資料驅動深入解析的潛力。
FabricDataFrame 資料結構
FabricDataFrame 是語意連結用來將語意資訊從語意模型傳播到 Synapse 資料科學環境的主要資料結構。
FabricDataFrame
類別:
- 支援所有 pandas 作業。
- 將 pandas DataFrame 歸入子類別並新增中繼資料,例如語意資訊和譜系。
- 公開語意函數和 add-measure 方法,可讓您在資料科學工作中使用 Power BI 量值。