Tables dans l’entrepôt de données dans Microsoft Fabric
S’applique à : Warehouse dans Microsoft Fabric
Cet article détaille les concepts clés pour la conception de tables dans Microsoft Fabric.
Dans les tables, les données sont logiquement organisées en lignes et en colonnes. Chaque ligne représente un enregistrement unique et chaque colonne représente un champ dans l'enregistrement.
- Dans l’entrepôt, les tables sont des objets de base de données qui contiennent toutes les données transactionnelles.
Déterminer la catégorie des tables
Un schéma en étoile organise les données dans des tables de faits et les tables de dimension. Certaines tables sont utilisées pour l’intégration ou la mise en lots des données avant leur transfert dans une table de faits ou de dimension. Quand vous concevez une table, déterminez si les données de la table sont contenues dans une table de faits, de dimension ou d’intégration. Ceci est important pour choisir une structure appropriées pour la table.
Les tables de faits contiennent des données quantitatives qui sont le plus souvent générées dans un système transactionnel avant d’être chargées dans l’entrepôt de données. Par exemple, une entreprise de vente au détail génère des transactions de ventes chaque jour et charge ensuite ces données dans une table de faits de l’entrepôt de données pour les analyser.
Les tables de dimension contiennent des données d’attribut modifiables, mais qui changent peu en règle générale. Par exemple, le nom et l’adresse d’un client sont stockés dans une table de dimension et sont mis à jour uniquement si le profil du client change. Pour réduire la taille d’une table de faits volumineuse, il est inutile d’indiquer le nom et l’adresse du client dans chaque ligne d’une table de faits. Au lieu de cela, la table de faits et la table de dimension peuvent partager un ID client. Vous pouvez alors créer une requête de jointure entre les deux tables pour associer le profil d’un client et les transactions qui le concernent.
Les tables d’intégration fournissent un emplacement pour l’intégration ou la mise en lots des données. Vous pouvez, par exemple, charger des données dans une table de mise en lots, effectuer des transformations sur ces données, puis insérer les données dans une table de production.
Une table stocke les données dans OneLake dans le cadre de l'entrepôt. La table et les données sont persistantes, qu’une session soit ouverte ou non.
Tables dans l'entrepôt
Pour voir l’organisation des tables, vous pouvez utiliser les préfixes fact
, dim
et int
dans les noms de table. La table suivante répertorie quelques noms de schéma et de table pour l’entrepôt de données exemple WideWorldImportersDW.
WideWorldImportersDW Nom de la table source | Type de la table | Data Warehouse Nom de la table |
---|---|---|
Ville | Dimension | wwi.DimCity |
Commande | Fact | wwi.FactOrder |
- Les noms de table sont sensibles à la casse.
- Les noms de tables ne peuvent pas contenir
/
ou\
, ou se terminer par un.
.
Créez une table.
Pour l’entrepôt, vous pouvez créer une table à partir d’une nouvelle table vide. Vous pouvez aussi créer une table et la remplir avec les résultats d’une instruction select. Le tableau suivant répertorie les instructions T-SQL disponibles pour la création d’une table.
Instruction T-SQL | Description |
---|---|
CREATE TABLE | Crée une table vide en définissant toutes les colonnes et options de la table. |
CREATE TABLE AS SELECT | Crée une table et la remplit avec les résultats d’une instruction select. Les colonnes et les types de données de la table sont basés sur les résultats de l’instruction select. Pour importer des données, cette instruction peut sélectionner les données dans une table externe. |
Cet exemple crée une table contenant deux colonnes :
CREATE TABLE MyTable (col1 int, col2 int );
Noms de schémas
L’entrepôt prend en charge la création de schémas personnalisés. Comme dans SQL Server, les schémas sont un bon moyen de regrouper des objets utilisés de manière similaire. Le code suivant crée un schéma défini par l’utilisateur nommé wwi
.
- Les noms de schéma sont sensibles à la casse.
- Les noms de schémas ne peuvent pas contenir
/
ou\
, ou se terminer par un.
.
CREATE SCHEMA wwi;
les types de données ;
Microsoft Fabric prend en charge les types de données T-SQL les plus couramment utilisés.
- Pour plus d’informations sur les types de données, consultez Types de données dans Microsoft Fabric.
- Lorsque vous créez une table dans l’entrepôt, passez en revue la référence des types de données dans CREATE TABLE (Transact-SQL).
- Pour obtenir un guide de création d’une table dans Warehouse, consultez Créer des tables.
Classement
Actuellement, Latin1_General_100_BIN2_UTF8
est le classement par défaut et uniquement pris en charge pour les tables et les métadonnées.
Statistiques
L’optimiseur de requête utilise des statistiques au niveau des colonnes quand il crée le plan d’exécution d’une requête. Pour améliorer les performances des requêtes, il est important d’avoir des statistiques sur des colonnes individuelles, en particulier les colonnes utilisées dans les jointures de requête. L’entrepôt prend en charge la création automatique de statistiques.
La mise à jour statistique ne se fait pas automatiquement. Mettez à jour les statistiques après l’ajout ou la modification d’un nombre significatif de lignes. Par exemple, effectuez une mise à jour des statistiques après un chargement. Pour plus d’informations, voir Statistiques.
Clé primaire, clé étrangère et clé unique
Pour l’entrepôt, les contraintes PRIMARY KEY et UNIQUE ne sont prises en charge que lorsque NONCLUSTERED et NOT ENFORCED sont tous deux utilisés.
FOREIGN KEY n'est pris en charge que lorsque NOT ENFORCED est utilisé.
- Pour la syntaxe, cochez ALTER TABLE.
- Pour plus d’informations, consultez Clé primaire, clés étrangères et clés uniques dans Entrepôt dans Microsoft Fabric.
Aligner les données sources avec l’entrepôt de données
Les tables de l’entrepôt sont remplies avec les données chargées à partir d’une autre source de données. Pour accomplir un chargement correct, le nombre et les types de données des colonnes dans les données sources doivent être alignés sur la définition de la table dans l’entrepôt de données.
Si les données proviennent de plusieurs magasins, vous pouvez les porter dans l’entrepôt de données et les stocker dans une table d’intégration. Vous pouvez ensuite effectuer des opérations de transformation sur les données de la table d’intégration en tirant parti de la puissance de l’entrepôt de données. Une fois que les données sont préparées, vous pouvez les insérer dans des tables de production.
Limites
L’entrepôt prend en charge beaucoup des fonctionnalités de table proposées par d’autres bases de données, mais pas toutes.
La liste suivante répertorie certaines fonctionnalités de table qui ne sont actuellement pas prises en charge.
- Nombre maximal de 1 024 colonnes par table
- Colonnes calculées
- Vues indexées
- tables partitionnées ;
- Séquence
- Colonnes éparses
- Clés de substitution sur les séquences de nombres avec des colonnes d’identité
- Synonymes
- tables temporaires ;
- Déclencheurs
- Index uniques
- Types définis par l'utilisateur