什麼是語意連結?
語意連結是一項功能,可讓您在 Microsoft Fabric 中建立語意模型與 Synapse 資料科學 之間的連線。 Microsoft Fabric 僅支援使用語意連結。
針對 Spark 3.4 和更新版本,使用 Fabric 時,預設運行時間提供語意連結,而且不需要加以安裝。 如果您使用 Spark 3.3 或更新版本,或想要更新為最新版本的 Semantic Link,您可以執行 命令:
%pip install -U semantic-link
語意連結的主要目標是促進數據連線、啟用語意信息的傳播,並與數據科學家所使用的已建立工具緊密整合,例如 筆記本。 語意連結可協助您以標準化方式保留數據語意的定義域知識,以加速數據分析並減少錯誤。
語意連結概觀
數據流會從包含數據和語意信息的語意模型開始。 語意鏈接會橋接 Power BI 與 資料科學 體驗之間的差距。
透過語意連結,您可以在 資料科學 體驗中使用Power BI的語意模型來執行工作,例如使用機器學習技術深入的統計分析和預測模型。 數據科學工作的輸出可以使用 Apache Spark 儲存在 OneLake 中,並使用 Direct Lake 內嵌至 Power BI。
Power BI 連線能力
語意模型可作為單 一表格式物件模型,為語意定義提供可靠的來源,例如 Power BI 量值。 若要連線到語意模型:
- 語意連結可透過 SemPy Python 連結庫提供 Python pandas 生態系統的數據連線,讓數據科學家輕鬆地處理數據。
- 語意連結可讓您透過 Spark原生連接器 存取語意模型,讓數據科學家更熟悉 Apache Spark 生態系統。 此實作支援各種語言,包括 PySpark、Spark SQL、R 和 Scala。
語意資訊的應用程式
數據中的語意資訊包括Power BI 資料類別 ,例如地址和郵遞區號、資料表之間的關聯性,以及階層式資訊。 這些數據類別包含語意鏈接傳播至 資料科學 環境的元數據,以啟用新的體驗並維護數據譜系。 語意連結的一些範例應用程式如下:
- 內 建語意函式的智慧型手機建議。
- 透過使用 新增量值來增強數據與Power BI量值的創新整合。
- 根據數據表與數據表內功能相依性之間的關聯性,進行 數據品質驗證 的工具。
語意連結是功能強大的工具,可讓商務分析師在完整的數據科學環境中有效地使用數據。 語意連結可藉由消除重新實作Power BI量值中內嵌的商業規則,促進數據科學家與商務分析師之間的順暢共同作業。 這種方法可確保雙方都能有效率且具生產力地運作,以最大化其數據驅動深入解析的潛力。
FabricDataFrame
數據結構
FabricDataFrame 是語意連結的核心數據結構。 它會將 pandas DataFrame 子類別化,並新增元數據,例如語意資訊和譜系。 FabricDataFrame 是語意鏈接用來將語意資訊從語意模型傳播到 資料科學 環境的主要數據結構。
FabricDataFrame 支援所有 pandas 作業等等。 它會公開語意函式和 add-measure 方法,讓您能夠在數據科學工作中使用 Power BI 量值。
相關內容
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應