Was ist Semantic Link?

Semantic Link ist ein Feature, mit dem Sie in Microsoft Fabric eine Verbindung zwischen semantischen Modellen und Synapse Data Science herstellen können. Die Verwendung von Semantic Link wird nur in Microsoft Fabric unterstützt.

Für Spark 3.4 und höher ist der semantische Link bei Verwendung von Fabric in der Standardlaufzeit verfügbar und muss nicht installiert werden. Wenn Sie Spark 3.3 oder darunter verwenden oder auf die neueste Version von Semantic Link aktualisieren möchten, können Sie den Befehl ausführen:

%pip install -U semantic-link

Semantic Link zielt im Wesentlichen darauf, ab, Datenkonnektivität sowie die Verteilung semantischer Informationen zu ermöglichen, und lässt sich nahtlos in etablierte, von Data Scientists genutzte Tools, wie z. B. Notebooks, integrieren. Semantic Link hilft Ihnen dabei, Fachwissen über die Datensemantik auf standardisierte Weise zu bewahren, sodass Datenanalysen beschleunigt und Fehler reduziert werden können.

Der Datenfluss beginnt mit semantischen Modellen, die Daten und semantische Informationen enthalten. Semantic Link schließt die Lücke zwischen Power BI und Data Science-Umgebungen.

Ein Diagramm, das den Datenfluss von Power BI zu Notebooks in Synapse Data Science und zurück zu Power BI zeigt.

Mit Semantic Link können Sie semantische Modelle aus Power BI in der Data Science-Umgebung verwenden, um Aufgaben wie detaillierte statistische Analysen und Predictive Modeling mit Machine Learning-Techniken auszuführen. Ihre Data Science-Ergebnisse können mit Apache Spark in OneLake gespeichert und über Direct Lake in Power BI erfasst werden.

Power BI-Konnektivität

Semantische Modelle dienen als einzelnes tabellarisches Objektmodell und stellen eine zuverlässige Quelle für semantische Definitionen wie z. B. Power BI-Measures bereit. So stellen Sie eine Verbindung mit semantischen Modellen her:

  • Semantic Link bietet über die SemPy Python-Bibliothek Datenkonnektivität mit dem Python-Pandas-Ökosystem, wodurch die Arbeit mit den Daten für Data Scientists erleichtert wird.
  • Semantic Link bietet auch Zugriff auf semantische Modelle über den nativen Spark-Connector für Data Scientists, die sich mit dem Apache Spark-Ökosystem besser auskennen. Diese Implementierung unterstützt verschiedene Sprachen, einschließlich PySpark, Spark SQL, R und Scala.

Anwendungsgebiete semantischer Informationen

Zu semantischen Informationen in Daten gehören Power BI-Datenkategorien wie z. B. Adresse und Postleitzahl, Beziehungen zwischen Tabellen und hierarchischen Informationen. Diese Datenkategorien bestehen aus Metadaten, die Semantic Link in die Data Science-Umgebung übermittelt, um neue Funktionen zu ermöglichen und die Datenherkunft beizubehalten. Einige Beispielanwendungen für Semantic Link:

Semantic Link ist ein leistungsfähiges Tool, mit dem Business Analysts Daten in einer umfangreichen Data Science-Umgebung effektiv nutzen können. Semantic Link erleichtert die nahtlose Zusammenarbeit zwischen Data Scientists und Business Analysts, da die in Power BI-Measures eingebettete Geschäftslogik nicht neu implementiert werden muss. Dieser Ansatz stellt sicher, dass beide Parteien effizient und produktiv arbeiten und das Potenzial ihrer datengesteuerten Erkenntnisse maximieren können.

FabricDataFrame-Datenstruktur

FabricDataFrame ist die Kerndatenstruktur von Semantic Link. Sie bildet Unterklassen von pandas.DataFrame und fügt Metadaten hinzu, z. B. semantische Informationen und Herkunft. FabricDataFrame ist die primäre Datenstruktur, die Semantic Link verwendet, um semantische Informationen aus semantischen Modellen in die Data Science-Umgebung zu verteilen.

Ein Diagramm, das den Datenfluss von Konnektoren zu semantischen Modellen zu FabricDataFrame zu semantischen Funktionen zeigt.

FabricDataFrame unterstützt alle Pandas-Operationen und vieles mehr. Die Struktur macht semantische Funktionen und die add-measure-Methode verfügbar, mit deren Hilfe Sie Power BI-Measures in Ihrer Data Science-Arbeit verwenden können.