Tables dans l’entreposage de données dans Microsoft Fabric

S’applique à : Entrepôt dans Microsoft Fabric

Cet article détaille les concepts clés pour la conception de tables dans Microsoft Fabric.

Dans les tables, les données sont organisées logiquement dans un format de ligne et de colonne. Chaque ligne représente un enregistrement unique et chaque colonne représente un champ dans l'enregistrement.

  • Dans Warehouse, les tables sont des objets de base de données qui contiennent toutes les données transactionnelles.

Important

Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.

Déterminer la catégorie des tables

Un schéma en étoile organise les données dans des tables de faits et de dimension. Certaines tables sont utilisées pour l’intégration ou la mise en lots des données avant leur transfert dans une table de faits ou de dimension. Quand vous concevez une table, déterminez si les données de la table sont contenues dans une table de faits, de dimension ou d’intégration. Cette décision informe la structure de table appropriée.

  • Les tables de faits contiennent des données quantitatives qui sont le plus souvent générées dans un système transactionnel avant d’être chargées dans l’entrepôt de données. Par exemple, une entreprise de vente au détail génère des transactions de ventes chaque jour et charge ensuite ces données dans une table de faits de l’entrepôt de données pour les analyser.

  • Les tables de dimension contiennent des données d’attribut modifiables, mais qui changent peu en règle générale. Par exemple, le nom et l’adresse d’un client sont stockés dans une table de dimension et sont mis à jour uniquement si le profil du client change. Pour réduire la taille d’une table de faits volumineuse, il est inutile d’indiquer le nom et l’adresse du client dans chaque ligne d’une table de faits. Au lieu de cela, la table de faits et la table de dimension peuvent partager un ID client. Vous pouvez alors créer une requête de jointure entre les deux tables pour associer le profil d’un client et les transactions qui le concernent.

  • Les tables d’intégration fournissent un emplacement pour l’intégration ou la mise en lots des données. Vous pouvez, par exemple, charger des données dans une table de mise en lots, effectuer des transformations sur ces données, puis insérer les données dans une table de production.

Une table stocke des données dans la vue d’ensemble de OneLake dans le cadre de l’entrepôt. La table et les données sont persistantes, qu’une session soit ouverte ou non.

Tables dans l’entrepôt

Pour afficher la organization des tables, vous pouvez utiliser fact, dimou int comme préfixes des noms de table. Le tableau suivant présente certains des noms de schéma et de table pour l’exemple d’entrepôt de données WideWorldImportersDW .

WideWorldImportersDW Nom de la table source Type de la table Data Warehouse nom de la table
City Dimension wwi.DimCity
JSON Fact wwi.FactOrder
  • Les noms de table respectent la casse.
  • Les noms de table ne peuvent pas contenir / ou \.

Créer une table

Pour Warehouse, vous pouvez créer une table en tant que table vide. Vous pouvez aussi créer une table et la remplir avec les résultats d’une instruction select. Le tableau suivant répertorie les instructions T-SQL disponibles pour la création d’une table.

Instruction T-SQL Description
CREATE TABLE Crée une table vide en définissant toutes les colonnes et options de la table.
CREATE TABLE AS SELECT Crée une table et la remplit avec les résultats d’une instruction select. Les colonnes et les types de données de la table sont basés sur les résultats de l’instruction select. Pour importer des données, cette instruction peut sélectionner les données dans une table externe.

Cet exemple crée une table avec deux colonnes :

CREATE TABLE MyTable (col1 int, col2 int );  

Noms de schémas

Warehouse prend en charge la création de schémas personnalisés. Comme dans SQL Server, les schémas sont un bon moyen de regrouper des objets qui sont utilisés de la même manière. Le code suivant crée un schéma défini par l’utilisateur nommé wwi.

CREATE SCHEMA wwi;

Types de données

Microsoft Fabric prend en charge les types de données T-SQL les plus couramment utilisés.

Classement

Actuellement, Latin1_General_100_BIN2_UTF8 est le classement par défaut et uniquement pris en charge pour les tables et les métadonnées.

Statistiques

L’optimiseur de requête utilise des statistiques au niveau des colonnes quand il crée le plan d’exécution d’une requête. Pour améliorer les performances des requêtes, il est important d’avoir des statistiques sur des colonnes individuelles, en particulier les colonnes utilisées dans les jointures de requête. Warehouse prend en charge la création automatique de statistiques.

La mise à jour statistique ne se fait pas automatiquement. Mettez à jour les statistiques après l’ajout ou la modification d’un nombre significatif de lignes. Par exemple, effectuez une mise à jour des statistiques après un chargement. Pour plus d’informations, consultez Statistiques.

Clé primaire, clé étrangère et clé unique

Pour l’entrepôt, la contrainte PRIMARY KEY et UNIQUE ne sont prises en charge que lorsque NONCLUSTERED et NOT ENFORCED sont tous deux utilisés.

FOREIGN KEY est pris en charge uniquement lorsque NOT ENFORCED est utilisé.

Aligner les données sources avec l’entrepôt de données

Les tables d’entrepôt sont remplies en chargeant des données à partir d’une autre source de données. Pour accomplir un chargement correct, le nombre et les types de données des colonnes dans les données sources doivent être alignés sur la définition de la table dans l’entrepôt de données.

Si les données proviennent de plusieurs magasins, vous pouvez les porter dans l’entrepôt de données et les stocker dans une table d’intégration. Une fois que les données se trouvent dans la table d’intégration, vous pouvez utiliser la puissance de l’entrepôt de données pour implémenter des opérations de transformation. Une fois que les données sont préparées, vous pouvez les insérer dans des tables de production.

Limites

Warehouse prend en charge un grand nombre, mais pas la totalité, des fonctionnalités de table offertes par d’autres bases de données.

La liste suivante présente certaines des fonctionnalités de table qui ne sont actuellement pas prises en charge. Pendant la préversion, cette liste est susceptible d’être modifiée.

  • Colonnes calculées
  • Vues indexées
  • Séquence
  • Colonnes éparses
  • Clés de substitution sur les séquences de nombres avec des colonnes d’identité
  • Synonymes
  • Déclencheurs
  • Index uniques
  • Types définis par l'utilisateur
  • tables temporaires ;

Étapes suivantes