Che cos'è il collegamento semantico?
Il collegamento semantico è una funzionalità che consente di stabilire una connessione tra i modelli semantici e Synapse Data Science in Microsoft Fabric. L'uso del collegamento semantico è supportato solo in Microsoft Fabric.
Per Spark 3.4 e versioni successive, il collegamento semantico è disponibile nel runtime predefinito quando si usa Fabric e non è necessario installarlo. Se si usa Spark 3.3 o versione successiva o se si vuole eseguire l'aggiornamento alla versione più recente di Semantic Link, è possibile eseguire il comando :
%pip install -U semantic-link
Gli obiettivi principali del collegamento semantico sono facilitare la connettività dei dati, abilitare la propagazione delle informazioni semantiche e integrarsi facilmente con gli strumenti stabiliti usati dai data scientist, ad esempio i notebook. il collegamento semantico consente di mantenere le conoscenze del dominio sulla semantica dei dati in modo standardizzato che consente di velocizzare l'analisi dei dati e ridurre gli errori.
Panoramica del collegamento semantico
Il flusso di dati inizia con modelli semantici che contengono dati e informazioni semantiche. Il collegamento semantico consente di colmare il divario tra Power BI e l'esperienza di data science.
Con il collegamento semantico, è possibile usare modelli semantici di Power BI nell'esperienza di data science per eseguire attività come l'analisi statistica approfondita e la modellazione predittiva con tecniche di Machine Learning. L'output del lavoro di data science può essere archiviato in OneLake usando Apache Spark e inserito in Power BI tramite Direct Lake.
Connettività Power BI
I modelli semantici fungono da singolo modello a oggetti tabulari, fornendo un'origine affidabile per le definizioni semantiche, ad esempio le misure di Power BI. Per connettersi ai modelli semantici:
- Il collegamento semantico offre la connettività dei dati all'ecosistema Pandas Python python tramite la libreria SemPy, semplificando l'uso dei dati da parte dei data scientist.
- Il collegamento semantico consente l'accesso ai modelli semantici tramite il connettore nativo Spark per data scientist più familiari con l'ecosistema Apache Spark . Questa implementazione supporta vari linguaggi, tra cui PySpark, Spark SQL, R e Scala.
Applicazioni di informazioni semantiche
Le informazioni semantiche nei dati includono categorie di dati di Power BI, ad esempio indirizzo e codice postale, relazioni tra tabelle e informazioni gerarchica. Queste categorie di dati includono metadati che il collegamento semantico si propaga nell'ambiente di data science per consentire nuove esperienze e gestire la derivazione dei dati. Alcune applicazioni di esempio di collegamento semantico sono:
- Suggerimenti intelligenti di funzioni semantiche predefinite.
- Integrazione innovativa per l'aumento dei dati con le misure di Power BI tramite l'uso di misure aggiuntive.
- Strumenti per la convalida della qualità dei dati in base alle relazioni tra tabelle e dipendenze funzionali all'interno delle tabelle.
Il collegamento semantico è uno strumento potente che consente agli analisti aziendali di usare i dati in modo efficace in un ambiente di data science completo. Il collegamento semantico semplifica la collaborazione tra data scientist e business analyst eliminando la necessità di riabilitare la logica di business incorporata nelle misure di Power BI. Questo approccio garantisce che entrambe le parti possano lavorare in modo efficiente e produttivo, ottimizzando il potenziale delle informazioni dettagliate basate sui dati.
FabricDataFrame
struttura dei dati
FabricDataFrame è la struttura di dati di base del collegamento semantico. Sottoclassa il dataframe pandas e aggiunge metadati, ad esempio informazioni semantiche e derivazione. FabricDataFrame è la struttura di dati primaria usata dal collegamento semantico per propagare informazioni semantiche dai modelli semantici nell'ambiente di data science.
FabricDataFrame supporta tutte le operazioni pandas e altro ancora. Espone funzioni semantiche e il metodo add-measure che consentono di usare le misure di Power BI nel lavoro di data science.
Contenuto correlato
- Approfondire l'esperienza di SemPy tramite la documentazione di riferimento di SemPy
- Esercitazione: Pulire i dati con dipendenze funzionali
- Altre informazioni sul collegamento semantico e sulla connettività di Power BI
- Come convalidare i dati con il collegamento semantico
- Esplorare e convalidare le relazioni nei modelli semantici
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per