Co je sémantický odkaz?

Sémantický odkaz je funkce, která umožňuje navázat spojení mezi sémantických modelů a Datová Věda Synapse v Microsoft Fabric. Použití sémantického odkazu je podporováno pouze v Microsoft Fabric.

Pro Spark 3.4 a vyšší je sémantický odkaz dostupný ve výchozím modulu runtime při použití prostředků infrastruktury a není nutné ho instalovat. Pokud používáte Spark 3.3 nebo novější nebo pokud chcete aktualizovat na nejnovější verzi sémantického odkazu, můžete příkaz spustit:

%pip install -U semantic-link

Hlavním cílem sémantického propojení je usnadnit připojení k datům, umožnit šíření sémantických informací a bezproblémovou integraci se zavedenými nástroji používanými odborníky na data, jako jsou poznámkové bloky. sémantický odkaz pomáhá zachovat znalosti domény o sémantice dat standardizovaným způsobem, který může urychlit analýzu dat a snížit chyby.

Tok dat začíná sémantickými modely, které obsahují data a sémantické informace. Sémantické propojení překlenuje mezeru mezi Power BI a Datová Věda prostředím.

Diagram znázorňující tok dat z Power BI do poznámkových bloků ve službě Synapse Datová Věda a zpět do Power BI

Sémantickým propojením můžete pomocí sémantických modelů z Power BI v prostředí Datová Věda provádět úlohy, jako je podrobná statistická analýza a prediktivní modelování pomocí technik strojového učení. Výstup vaší práce s datovými vědami je možné uložit ve OneLake pomocí Apache Sparku a ingestovat do Power BI pomocí Direct Lake.

Připojení Power BI

Sémantické modely slouží jako jediný tabulkový objektový model, který poskytuje spolehlivý zdroj pro sémantické definice, jako jsou míry Power BI. Připojení k sémantickým modelům:

  • Sémantický odkaz nabízí datové připojení k ekosystému Knihovny Python pandas v Pythonu prostřednictvím knihovny SemPy Python, což usnadňuje práci s daty datovým vědcům.
  • Sémantický odkaz poskytuje přístup k sémantickým modelům prostřednictvím nativního konektoru Sparku pro datové vědce, kteří jsou obeznámeni s ekosystémem Apache Spark. Tato implementace podporuje různé jazyky, včetně PySpark, Spark SQL, R a Scala.

Použití sémantických informací

Sémantické informace v datech zahrnují kategorie dat Power BI, jako jsou adresy a PSČ, relace mezi tabulkami a hierarchické informace. Tyto kategorie dat obsahují metadata, která se sémantické propojení rozšíří do Datová Věda prostředí, aby bylo možné nové prostředí a udržovat rodokmen dat. Mezi příklady použití sémantického odkazu patří:

  • Inteligentní návrhy předdefinovaných sémantických funkcí
  • Inovativní integrace pro rozšiřování dat pomocí měr Power BI pomocí doplňkových měr.
  • Nástroje pro ověřování kvality dat na základě relací mezi tabulkami a funkčními závislostmi v tabulkách

Sémantický odkaz je výkonný nástroj, který obchodním analytikům umožňuje efektivně využívat data v komplexním prostředí datových věd. Sémantické propojení usnadňuje bezproblémovou spolupráci mezi datovými vědci a obchodními analytiky tím, že eliminuje potřebu reimplementovat obchodní logiku vloženou do měr Power BI. Tento přístup zajišťuje, že obě strany budou moct efektivně a produktivně pracovat a maximalizovat tak potenciál svých přehledů řízených daty.

FabricDataFrame datová struktura

FabricDataFrame je základní datová struktura sémantického propojení. Podtřídí datový rámec pandas a přidá metadata, jako jsou sémantické informace a rodokmen. FabricDataFrame je primární datová struktura, kterou sémantický odkaz používá k šíření sémantických informací z sémantických modelů do Datová Věda prostředí.

Diagram znázorňující tok dat z konektorů do sémantických modelů do objektu FabricDataFrame do sémantických funkcí

FabricDataFrame podporuje všechny operace pandas a další. Zveřejňuje sémantické funkce a metodu doplňku, která umožňuje používat míry Power BI v práci datových věd.