Vad är semantisk länk?

Semantisk länk är en funktion som gör att du kan upprätta en anslutning mellan semantiska modeller och Synapse Datavetenskap i Microsoft Fabric. Användning av semantisk länk stöds endast i Microsoft Fabric.

För Spark 3.4 och senare är Semantic-länken tillgänglig i standardkörningen när du använder Infrastrukturresurser, och du behöver inte installera den. Om du använder Spark 3.3 eller senare, eller om du vill uppdatera till den senaste versionen av Semantic Link, kan du köra kommandot:

%pip install -U semantic-link

De främsta målen med semantisk länk är att underlätta dataanslutning, möjliggöra spridning av semantisk information och sömlöst integrera med etablerade verktyg som används av dataforskare, till exempel notebook-filer. semantisk länk hjälper dig att bevara domänkunskap om datasemantik på ett standardiserat sätt som kan påskynda dataanalys och minska fel.

Dataflödet börjar med semantiska modeller som innehåller data och semantisk information. Semantisk länk överbryggar klyftan mellan Power BI och den Datavetenskap upplevelsen.

Ett diagram som visar dataflödet från Power BI till notebook-filer i Synapse Datavetenskap och tillbaka till Power BI.

Med semantisk länk kan du använda semantiska modeller från Power BI i Datavetenskap erfarenhet för att utföra uppgifter som djupgående statistisk analys och förutsägelsemodellering med maskininlärningstekniker. Utdata från ditt datavetenskapsarbete kan lagras i OneLake med Apache Spark och matas in i Power BI med Direct Lake.

Power BI-anslutning

Semantiska modeller fungerar som en tabellobjektmodell, vilket ger en tillförlitlig källa för semantiska definitioner, till exempel Power BI-mått. Så här ansluter du till semantiska modeller:

  • Semantisk länk erbjuder dataanslutning till Python Pandas-ekosystemetvia SemPy Python-biblioteket, vilket gör det enkelt för dataexperter att arbeta med data.
  • Semantisk länk ger åtkomst till semantiska modeller via den inbyggda Spark-anslutningsappen för dataforskare som är mer bekanta med Apache Spark-ekosystemet. Den här implementeringen stöder olika språk, inklusive PySpark, Spark SQL, R och Scala.

Program för semantisk information

Semantisk information i data inkluderar Power BI-datakategorier som adress och postnummer, relationer mellan tabeller och hierarkisk information. Dessa datakategorier består av metadata som semantisk länk sprids till den Datavetenskap miljön för att möjliggöra nya upplevelser och underhålla data härkomst. Några exempelprogram för semantisk länk är:

  • Intelligenta förslag på inbyggda semantiska funktioner.
  • Innovativ integrering för att utöka data med Power BI-mått med hjälp av tilläggsåtgärder.
  • Verktyg för validering av datakvalitet baserat på relationerna mellan tabeller och funktionella beroenden i tabeller.

Semantisk länk är ett kraftfullt verktyg som gör det möjligt för affärsanalytiker att använda data effektivt i en omfattande datavetenskapsmiljö. Semantisk länk underlättar sömlöst samarbete mellan dataforskare och affärsanalytiker genom att eliminera behovet av att omimplementeras affärslogik inbäddad i Power BI-mått. Den här metoden säkerställer att båda parter kan arbeta effektivt och produktivt, vilket maximerar potentialen i deras datadrivna insikter.

FabricDataFrame datastruktur

FabricDataFrame är kärndatastrukturen för semantisk länk. Den underklassar Pandas DataFrame och lägger till metadata, till exempel semantisk information och ursprung. FabricDataFrame är den primära datastruktur som semantisk länk använder för att sprida semantisk information från semantiska modeller till den Datavetenskap miljön.

Ett diagram som visar dataflödet från anslutningsappar till semantiska modeller till FabricDataFrame till Semantic Functions.

FabricDataFrame stöder alla Pandas-åtgärder med mera. Den exponerar semantiska funktioner och metoden add-measure som gör att du kan använda Power BI-mått i ditt datavetenskapsarbete.