Che cos'è il collegamento semantico?

Il collegamento semantico è una funzionalità che consente di stabilire una connessione tra i modelli semantici e Synapse Data Science in Microsoft Fabric. L'uso del collegamento semantico è supportato solo in Microsoft Fabric.

Per Spark 3.4 e versioni successive, il collegamento semantico è disponibile nel runtime predefinito quando si usa Fabric e non è necessario installarlo. Se si usa Spark 3.3 o versione successiva o se si vuole eseguire l'aggiornamento alla versione più recente di Semantic Link, è possibile eseguire il comando :

%pip install -U semantic-link

Gli obiettivi principali del collegamento semantico sono facilitare la connettività dei dati, abilitare la propagazione delle informazioni semantiche e integrarsi facilmente con gli strumenti stabiliti usati dai data scientist, ad esempio i notebook. il collegamento semantico consente di mantenere le conoscenze del dominio sulla semantica dei dati in modo standardizzato che consente di velocizzare l'analisi dei dati e ridurre gli errori.

Il flusso di dati inizia con modelli semantici che contengono dati e informazioni semantiche. Il collegamento semantico consente di colmare il divario tra Power BI e l'esperienza di data science.

Diagramma che mostra il flusso di dati da Power BI ai notebook in Synapse Data Science e di nuovo in Power BI.

Con il collegamento semantico, è possibile usare modelli semantici di Power BI nell'esperienza di data science per eseguire attività come l'analisi statistica approfondita e la modellazione predittiva con tecniche di Machine Learning. L'output del lavoro di data science può essere archiviato in OneLake usando Apache Spark e inserito in Power BI tramite Direct Lake.

Connettività Power BI

I modelli semantici fungono da singolo modello a oggetti tabulari, fornendo un'origine affidabile per le definizioni semantiche, ad esempio le misure di Power BI. Per connettersi ai modelli semantici:

  • Il collegamento semantico offre la connettività dei dati all'ecosistema Pandas Python python tramite la libreria SemPy, semplificando l'uso dei dati da parte dei data scientist.
  • Il collegamento semantico consente l'accesso ai modelli semantici tramite il connettore nativo Spark per data scientist più familiari con l'ecosistema Apache Spark . Questa implementazione supporta vari linguaggi, tra cui PySpark, Spark SQL, R e Scala.

Applicazioni di informazioni semantiche

Le informazioni semantiche nei dati includono categorie di dati di Power BI, ad esempio indirizzo e codice postale, relazioni tra tabelle e informazioni gerarchica. Queste categorie di dati includono metadati che il collegamento semantico si propaga nell'ambiente di data science per consentire nuove esperienze e gestire la derivazione dei dati. Alcune applicazioni di esempio di collegamento semantico sono:

  • Suggerimenti intelligenti di funzioni semantiche predefinite.
  • Integrazione innovativa per l'aumento dei dati con le misure di Power BI tramite l'uso di misure aggiuntive.
  • Strumenti per la convalida della qualità dei dati in base alle relazioni tra tabelle e dipendenze funzionali all'interno delle tabelle.

Il collegamento semantico è uno strumento potente che consente agli analisti aziendali di usare i dati in modo efficace in un ambiente di data science completo. Il collegamento semantico semplifica la collaborazione tra data scientist e business analyst eliminando la necessità di riabilitare la logica di business incorporata nelle misure di Power BI. Questo approccio garantisce che entrambe le parti possano lavorare in modo efficiente e produttivo, ottimizzando il potenziale delle informazioni dettagliate basate sui dati.

FabricDataFrame struttura dei dati

FabricDataFrame è la struttura di dati di base del collegamento semantico. Sottoclassa il dataframe pandas e aggiunge metadati, ad esempio informazioni semantiche e derivazione. FabricDataFrame è la struttura di dati primaria usata dal collegamento semantico per propagare informazioni semantiche dai modelli semantici nell'ambiente di data science.

Diagramma che mostra il flusso di dati dai connettori ai modelli semantici a FabricDataFrame a Funzioni semantiche.

FabricDataFrame supporta tutte le operazioni pandas e altro ancora. Espone funzioni semantiche e il metodo add-measure che consentono di usare le misure di Power BI nel lavoro di data science.