Freigeben über


Was ist Semantic Link?

Semantic Link ist ein Feature, mit dem Sie in Microsoft Fabric eine Verbindung zwischen semantischen Modellen und Synapse Data Science herstellen können. Die Verwendung von Semantic Link wird nur in Microsoft Fabric unterstützt.

  • Für Spark 3.4 und höher ist Semantic Link bei Verwendung von Fabric in der Standardlaufzeit verfügbar und muss nicht installiert werden.

  • Führe für Spark 3.3 oder niedriger oder zum Aktualisieren auf die neueste Version von Semantic Link den folgenden Befehl aus:

    %pip install -U semantic-link
    

Die wichtigsten Ziele von Semantic Link sind:

  • Vereinfachen der Datenkonnektivität.
  • Aktivieren der Verteilung semantischer Informationen.
  • Nahtlose Integration mit etablierten Tools, die wissenschaftliche Fachkräfte für Daten verwenden, z. B. Notebooks.

Semantic Link hilft dir dabei, Domänenwissen über die Datensemantik auf standardisierte Weise zu bewahren, sodass Datenanalysen beschleunigt und Fehler reduziert werden können.

Der Semantic Link-Datenfluss beginnt mit semantischen Modellen, die Daten und semantische Informationen enthalten. Semantic Link schließt die Lücke zwischen Power BI und Synapse Data Science-Umgebung.

Ein Diagramm, das den Datenfluss von Power BI zu Notebooks in Synapse Data Science und zurück zu Power BI zeigt.

Mit Semantic Link kannst du semantische Modelle aus Power BI in der Synapse Data Science-Umgebung verwenden, um Aufgaben wie detaillierte statistische Analysen und Predictive Modeling mit Machine Learning-Techniken auszuführen. Du kannst die Ausgabe deiner Data Science-Arbeit mit Apache Spark in OneLake speichern und die gespeicherte Ausgabe über Direct Lake in Power BI einbringen.

Power BI-Konnektivität

Semantische Modelle dienen als einzelnes tabellarisches Objektmodell und stellen eine zuverlässige Quelle für semantische Definitionen wie z. B. Power BI-Measures dar. Semantic Link verbindet sich mit semantischen Modellen in den folgenden Ökosystemen, sodass wissenschaftliche Fachkräfte für Daten am einfachsten im System arbeiten können, mit dem sie am meisten vertraut sind.

  • Python Pandas-Ökosystem über die SemPy Python-Bibliothek.
  • Apache Spark-Ökosystem über den Spark Native Connector. Diese Implementierung unterstützt verschiedene Sprachen, einschließlich PySpark, Spark SQL, R und Scala.

Anwendungsgebiete semantischer Informationen

Zu semantischen Informationen in Daten gehören Power BI-Datenkategorien wie z. B. Adresse und Postleitzahl, Beziehungen zwischen Tabellen und hierarchischen Informationen.

Diese Datenkategorien bestehen aus Metadaten, die Semantic Link in die Synapse Data Science-Umgebung übermittelt, um neue Funktionen zu ermöglichen und die Datenherkunft beizubehalten.

Einige Beispielanwendungen für Semantic Link umfassen:

Semantic Link ist ein leistungsfähiges Tool, mit dem Business Analysts Daten in einer umfangreichen Data Science-Umgebung effektiv nutzen können.

Semantic Link erleichtert die nahtlose Zusammenarbeit zwischen Data Scientists und Business Analysts, da die in Power BI-Measures eingebettete Geschäftslogik nicht neu implementiert werden muss. Dieser Ansatz stellt sicher, dass beide Parteien effizient und produktiv arbeiten und das Potenzial ihrer datengesteuerten Erkenntnisse maximieren können.

FabricDataFrame-Datenstruktur

FabricDataFrame ist die primäre Datenstruktur, die Semantic Link verwendet, um semantische Informationen aus semantischen Modellen in die Data Science-Umgebung zu verteilen.

Ein Diagramm, das den Datenfluss von Konnektoren zu semantischen Modellen zu FabricDataFrame zu semantischen Funktionen zeigt.

Die FabricDataFrame-Klasse:

  • Unterstützt alle Pandas-Operationen.
  • Sie bildet Unterklassen von pandas DataFrame und fügt Metadaten hinzu, z. B. semantische Informationen und Herkunft.
  • Macht semantische Funktionen und die add-measure-Methode verfügbar, mit deren Hilfe du Power BI-Measures in deiner Data Science-Arbeit verwenden kannst.