Comprendre les datamarts

Cet article décrit et explique les concepts importants à comprendre sur les datamarts.

Les datamarts fournissent une couche sémantique qui est automatiquement générée et synchronisée avec le contenu des tables du datamart, leur structure et les données sous-jacentes, le tout fourni dans un jeu de données généré automatiquement. Cette génération et cette synchronisation automatiques vous permettent de décrire plus précisément le domaine des données à l’aide d’éléments, comme des hiérarchies, des noms conviviaux et des descriptions, ainsi que de définir un formatage spécifique à votre région ou à vos exigences professionnelles. Avec les datamarts, vous pouvez également créer des métriques et des paramètres standardisés pour les rapports. Power BI (et d’autres outils clients) peut créer des visuels et fournir des résultats pour de tels calculs en fonction des données en contexte.

Grâce au jeu de données Power BI généré automatiquement créé à partir d’un datamart, il n’est plus nécessaire de se connecter à un jeu de données distinct, de définir des calendriers d’actualisation et de gérer plusieurs éléments de données. Au lieu de cela, vous pouvez construire votre logique d’entreprise dans un datamart et ses données seront immédiatement disponibles dans Power BI, ce qui permet ce qui suit :

  • Accès aux données de datamart via le hub de jeu de données
  • Capacité d’analyser dans Excel
  • Capacité de créer rapidement des rapports dans le service Power BI
  • Il n’est pas nécessaire d’actualiser, de synchroniser les données ou de comprendre les détails de la connexion
  • Créer des solutions sur le web sans avoir besoin de Power BI Desktop

Pendant la préversion, la connectivité des jeux de données générés automatiquement n’est disponible qu’en utilisant DirectQuery. L’image suivante montre comment les datamarts s’intègrent dans le continuum des processus, depuis la connexion aux données jusqu’à la création de rapports.

Diagramme qui montre comment les datamarts s’inscrivent dans le continuum de la connexion et de l’analyse des données.

Les jeux de données générés automatiquement diffèrent des jeux de données Power BI traditionnels de la manière suivante.

Le point de terminaison XMLA prend en charge les opérations en lecture seule et les utilisateurs ne peuvent pas modifier directement le jeu de données. Les jeux de données générés automatiquement n’ont pas de paramètres de source de données et les utilisateurs n’ont pas à saisir d’informations d’identification. Ils utilisent plutôt l’authentification unique automatique pour les requêtes. Pour les opérations d’actualisation, les jeux de données utilisent les informations d’identification de l’auteur du jeu de données pour se connecter au point de terminaison SQL du datamart géré.

Avec Power BI Desktop, les utilisateurs peuvent créer des modèles composites, ce qui vous permet de vous connecter au jeu de données du datamart et de faire ce qui suit :

  • Sélectionner des tables spécifiques à analyser
  • Ajout d’autres sources de données

Enfin, si vous ne souhaitez pas utiliser directement le jeu de données généré automatiquement, vous pouvez vous connecter au point de terminaison SQL du datamart. Consultez créer des rapports en utilisant des datamarts pour plus d’informations.

Comprendre l’actualisation incrémentielle et les datamarts

Vous pouvez créer et modifier l’actualisation incrémentielle des données, similaire à l’actualisation incrémentielle des flux et jeux de données, en utilisant l’éditeur de datamart. L’actualisation incrémentielle étend les opérations d’actualisation planifiées en fournissant une création et une gestion de partition automatisées pour les tables de datamart qui chargent fréquemment des données nouvelles et mises à jour.

Pour la plupart des datamarts, l’actualisation incrémentielle implique une ou plusieurs tables qui contiennent des données de transaction qui changent souvent et peuvent croître de manière exponentielle, comme une table de faits dans un schéma de base de données relationnel ou en étoile. L’utilisation d’une stratégie d’actualisation incrémentielle pour partitionner la table, et l’actualisation des partitions importées les plus récemment uniquement peuvent réduire de manière significative la quantité de données qui doivent être actualisées.

L’actualisation incrémentielle et les données en temps réel pour les datamarts offrent les avantages suivants :

  • Moins de cycles d’actualisation pour les données qui changent rapidement
  • Les actualisations sont plus rapides
  • Les actualisations sont plus fiables
  • La consommation des ressources est réduite
  • Permet de créer des datamarts de grande taille
  • Facile à configurer

Présentation de la mise en cache proactive

La mise en cache proactive permet l’importation automatique des données sous-jacentes pour le jeu de données généré automatiquement. Ainsi, vous n’avez pas besoin de gérer ni d’orchestrer le mode de stockage. Le mode d’importation du jeu de données généré automatiquement fournit une accélération des performances pour le jeu de données du datamart à l’aide du moteur Vertipaq rapide. En utilisant la mise en cache proactive, Power BI modifie le mode de stockage de votre modèle à importer, qui utilise le moteur en mémoire dans Power BI et Analysis Services.

La mise en cache proactive fonctionne de la manière suivante : après chaque actualisation, le mode de stockage du jeu de données généré automatiquement est modifié en DirectQuery. La mise en cache proactive génère un modèle d’importation côte à côte de façon asynchrone. Elle est gérée par le datamart et n’a pas d’impact sur la disponibilité ou les performances du datamart. Les requêtes qui entrent après la fin du jeu de données généré automatiquement utilisent le modèle d’importation.

La génération automatique du modèle d’importation se produit au bout de dix minutes environ si aucune modification n’est détectée dans le datamart. Les modifications apportées au jeu de données d’importation sont les suivantes :

  • Actualisations
  • Nouvelles sources de données
  • Modifications du schéma :
    • Nouvelles sources de données
    • Mises à jour apportées aux étapes de préparation des données dans Power Query Online
  • Toutes les mises à jour de modélisation, telles que :
    • Mesures
    • Hiérarchies
    • Descriptions

Meilleures pratiques pour la mise en cache proactive

Utilisez les pipelines de déploiement pour garantir les meilleures performances et vous assurer que les utilisateurs utilisent le modèle d’importation. L’utilisation de pipelines de déploiement est déjà une bonne pratique pour créer des datamarts, mais cela vous permet aussi de tirer parti de la mise en cache proactive plus souvent.

Considérations et limitations relatives à la mise en cache proactive

  • Power BI limite actuellement la durée des opérations de mise en cache à dix minutes.
  • Les contraintes d’unicité/de valeurs non-null pour des colonnes particulières sont appliquées dans le modèle d’importation et font échouer la génération du cache si les données ne sont pas conformes.

Étapes suivantes

Cet article vous a donné un aperçu des concepts importants à comprendre en matière de datamart.

Les articles suivants vous permettront d’en savoir plus sur les datamarts et Power BI :

Pour plus d’informations sur les flux de données et la transformation des données, consultez les articles suivants :