Share via


Qu'est-ce que le lien sémantique ?

Le lien sémantique est une fonctionnalité qui vous permet d'établir une connexion entre les modèles sémantiques et Science des données Synapse dans Microsoft Fabric. L'utilisation du lien sémantique est uniquement prise en charge dans Microsoft Fabric.

Pour Spark 3.4 et versions ultérieures, le lien sémantique est disponible dans le runtime par défaut lors de l’utilisation de Fabric et il n’est pas nécessaire de l’installer. Si vous utilisez Spark 3.3 ou version inférieure, ou si vous souhaitez effectuer une mise à jour vers la version la plus récente du lien sémantique, vous pouvez exécuter la commande :

%pip install -U semantic-link

Les principaux objectifs du lien sémantique sont de faciliter la connectivité des données, de permettre la propagation des informations sémantiques et de s'intégrer de manière transparente aux outils établis utilisés par les data scientists, tels que les blocs-notes. le lien sémantique vous aide à préserver les connaissances du domaine sur la sémantique des données d'une manière standardisée, ce qui peut accélérer l'analyse des données et réduire les erreurs.

Le flux de données commence par les modèles sémantiques qui contiennent des données et des informations sémantiques. Le lien sémantique comble le fossé entre Power BI et l’expérience Data Science.

Diagramme montrant le flux de données de Power BI allant vers les notebooks dans Science des données Synapse et revenant à Power BI.

Grâce au lien sémantique, vous pouvez utiliser des modèles sémantiques de Power BI dans l'expérience Science des données pour effectuer des tâches telles qu'une analyse statistique approfondie et une modélisation prédictive avec des techniques d'apprentissage automatique. La sortie de votre travail de science des données peut être stockée dans OneLake à l’aide d’Apache Spark et ingérée dans Power BI à l’aide de Direct Lake.

Connectivité Power BI

Les modèles sémantiques servent de modèle objet tabulaire unique, fournissant une source fiable pour les définitions sémantiques, telles que les mesures Power BI. Pour vous connecter à des modèles sémantiques :

  • Le lien sémantique offre une connectivité des données à l'écosystème Python pandas via la bibliothèque SemPy Python, permettant aux data scientists de travailler facilement avec les données.
  • Le lien sémantique permet d'accéder aux modèles sémantiques via le connecteur natif Spark pour les scientifiques des données plus familiers avec l'écosystème Apache Spark. Cette implémentation prend en charge différents langages, notamment PySpark, Spark SQL, R et Scala.

Applications d’informations sémantiques

Les informations sémantiques dans les données incluent des catégories de données Power BI telles que l’adresse et le code postal, les relations entre les tables et les informations hiérarchiques. Ces catégories de données comprennent des métadonnées que le lien sémantique propage dans l'environnement Data Science pour permettre de nouvelles expériences et maintenir la lignée des données. Voici quelques exemples d'applications du lien sémantique :

Le lien sémantique est un outil puissant qui permet aux analystes commerciaux d'utiliser efficacement les données dans un environnement complet de science des données. Le lien sémantique facilite une collaboration transparente entre les data scientists et les analystes métier en éliminant le besoin de réimplémenter la logique métier intégrée dans les mesures Power BI. Cette approche garantit que les deux parties peuvent travailler de manière efficace et productive, ce qui optimise le potentiel de leurs insights pilotés par les données.

Structure des données FabricDataFrame

FabricDataFrame est la structure de données de base du lien sémantique. Il sous-classe le DataFrame pandas et ajoute des métadonnées, telles que des informations sémantiques et la traçabilité. FabricDataFrame est la structure de données principale utilisée par le lien sémantique pour propager les informations sémantiques des modèles sémantiques dans l'environnement Science des données.

Diagramme montrant le flux de données des connecteurs vers des modèles sémantiques vers FabricDataFrame vers des fonctions sémantiques.

FabricDataFrame prend en charge toutes les opérations pandas et bien plus encore. Il expose des fonctions sémantiques et la méthode add-measure qui vous permettent d’utiliser des mesures Power BI dans votre travail de science des données.