Qu'est-ce que le lien sémantique ?
Le lien sémantique est une fonctionnalité qui vous permet d'établir une connexion entre les modèles sémantiques et Science des données Synapse dans Microsoft Fabric. L'utilisation du lien sémantique est uniquement prise en charge dans Microsoft Fabric.
Pour Spark 3.4 et versions ultérieures, le lien sémantique est disponible dans le runtime par défaut lors de l’utilisation de Fabric et il n’est pas nécessaire de l’installer. Si vous utilisez Spark 3.3 ou version inférieure, ou si vous souhaitez effectuer une mise à jour vers la version la plus récente du lien sémantique, vous pouvez exécuter la commande :
%pip install -U semantic-link
Les principaux objectifs du lien sémantique sont de faciliter la connectivité des données, de permettre la propagation des informations sémantiques et de s'intégrer de manière transparente aux outils établis utilisés par les data scientists, tels que les blocs-notes. le lien sémantique vous aide à préserver les connaissances du domaine sur la sémantique des données d'une manière standardisée, ce qui peut accélérer l'analyse des données et réduire les erreurs.
Aperçu du lien sémantique
Le flux de données commence par les modèles sémantiques qui contiennent des données et des informations sémantiques. Le lien sémantique comble le fossé entre Power BI et l’expérience Data Science.
Grâce au lien sémantique, vous pouvez utiliser des modèles sémantiques de Power BI dans l'expérience Science des données pour effectuer des tâches telles qu'une analyse statistique approfondie et une modélisation prédictive avec des techniques d'apprentissage automatique. La sortie de votre travail de science des données peut être stockée dans OneLake à l’aide d’Apache Spark et ingérée dans Power BI à l’aide de Direct Lake.
Connectivité Power BI
Les modèles sémantiques servent de modèle objet tabulaire unique, fournissant une source fiable pour les définitions sémantiques, telles que les mesures Power BI. Pour vous connecter à des modèles sémantiques :
- Le lien sémantique offre une connectivité des données à l'écosystème Python pandas via la bibliothèque SemPy Python, permettant aux data scientists de travailler facilement avec les données.
- Le lien sémantique permet d'accéder aux modèles sémantiques via le connecteur natif Spark pour les scientifiques des données plus familiers avec l'écosystème Apache Spark. Cette implémentation prend en charge différents langages, notamment PySpark, Spark SQL, R et Scala.
Applications d’informations sémantiques
Les informations sémantiques dans les données incluent des catégories de données Power BI telles que l’adresse et le code postal, les relations entre les tables et les informations hiérarchiques. Ces catégories de données comprennent des métadonnées que le lien sémantique propage dans l'environnement Data Science pour permettre de nouvelles expériences et maintenir la lignée des données. Voici quelques exemples d'applications du lien sémantique :
- Suggestions intelligentes de fonctions sémantiques intégrées.
- Intégration innovante pour augmenter les données avec les mesures Power BI grâce à l’utilisation d’add-measures.
- Outils de validation de la qualité des données en fonction des relations entre les tables et les dépendances fonctionnelles au sein des tables.
Le lien sémantique est un outil puissant qui permet aux analystes commerciaux d'utiliser efficacement les données dans un environnement complet de science des données. Le lien sémantique facilite une collaboration transparente entre les data scientists et les analystes métier en éliminant le besoin de réimplémenter la logique métier intégrée dans les mesures Power BI. Cette approche garantit que les deux parties peuvent travailler de manière efficace et productive, ce qui optimise le potentiel de leurs insights pilotés par les données.
Structure des données FabricDataFrame
FabricDataFrame est la structure de données de base du lien sémantique. Il sous-classe le DataFrame pandas et ajoute des métadonnées, telles que des informations sémantiques et la traçabilité. FabricDataFrame est la structure de données principale utilisée par le lien sémantique pour propager les informations sémantiques des modèles sémantiques dans l'environnement Science des données.
FabricDataFrame prend en charge toutes les opérations pandas et bien plus encore. Il expose des fonctions sémantiques et la méthode add-measure qui vous permettent d’utiliser des mesures Power BI dans votre travail de science des données.
Contenu connexe
- Approfondir votre expertise de SemPy via la documentation de référence de SemPy
- Tutoriel : Nettoyer les données avec des dépendances fonctionnelles
- En savoir plus sur le lien sémantique et la connectivité Power BI
- Comment valider les données avec lien sémantique
- Explorer et valider les relations dans des modèles sémantiques
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour