Décrire les concepts de base de la modélisation de données

Effectué

Les modèles analytiques, également appelés modèles semantiques dans Microsoft Fabric et Power BI, structurent les données pour prendre en charge l’analyse. Un modèle est généré à partir de tables de données associées. Il définit les valeurs numériques que vous souhaitez analyser ou signaler, appelées mesures, et les entités que vous utilisez pour les agréger, appelées dimensions.

Par exemple, un modèle peut inclure des mesures numériques pour les ventes (telles que le chiffre d’affaires ou la quantité) et les dimensions des produits, des clients et du temps. Cela vous permet d’agréger des mesures sur une ou plusieurs dimensions, par exemple, pour identifier le chiffre d’affaires total par client ou le total des articles vendus par produit par mois.

Tables et schéma

Les tables de dimension représentent les entités à regrouper ou filtrer par exemple, produit ou client. Chaque ligne a une valeur de clé unique et les colonnes restantes stockent des attributs tels que les noms de produits, les catégories ou les villes clientes. La plupart des modèles analytiques incluent une dimension Time afin de pouvoir agréger des mesures sur plusieurs périodes.

Les tables de faits stockent les mesures numériques que vous souhaitez analyser. Chaque ligne représente un événement enregistré, par exemple une transaction de vente avec des valeurs pour la quantité vendue et le chiffre d’affaires.

Diagramme d’un schéma en étoile.

Lorsqu’une table de faits est liée à une ou plusieurs tables de dimension, la conception est appelée schéma en étoile. Si les tables de dimension se rapportent davantage à des tables de détails supplémentaires( par exemple, une table Category liée à une table Product ), la conception est appelée schéma flocon de neige.

Lorsque vous chargez des données dans un modèle sémantique, Power BI les stocke dans un magasin en colonnes en mémoire efficace à l’aide du moteur VertiPaq. Les agrégations sont calculées au moment de la requête, ce qui fournit une analyse et des rapports rapides.

Hiérarchies d’attribut

Les hiérarchies vous permettent de naviguer vers le haut ou vers le bas parmi les valeurs agrégées à différents niveaux d’une dimension. Par exemple:

  • Dans la table Product , une hiérarchie peut regrouper des produits sous des catégories.
  • Dans la table Customer , une hiérarchie peut regrouper les clients par ville.
  • Dans la table Time , une hiérarchie peut regrouper des jours en mois et des mois en années.

Lorsque vous affichez le total des ventes par année, puis descendez pour voir une répartition mensuelle, le moteur VertiPaq calcule les valeurs agrégées à chaque niveau au moment de la requête.

Diagramme d’une hiérarchie de données.

Modélisation analytique dans Microsoft Power BI

Dans Power BI, vous définissez un modèle sémantique à partir de tables importées à partir d’une ou plusieurs sources de données. Utilisez la vue Model dans Power BI Desktop pour créer des relations entre les tables de faits et de dimension, définir des hiérarchies, définir des types de données et des formats d’affichage, et configurer d’autres propriétés qui modélisent votre modèle à des fins d’analyse.

Capture d’écran de l’affichage Modèle dans Power BI Desktop.

Si vos données sont stockées dans OneLake (lac de données partagé de Microsoft Fabric), utilisez Direct Lake mode de stockage pour connecter votre modèle sémantique directement aux fichiers lake. Cela vous donne des performances de requête en mémoire sans étape d’importation de données distincte.