Présentation des datamarts

Les utilisateurs professionnels s’appuient fortement sur des sources de données gérées de manière centralisée créées par des équipes informatiques, mais cela peut prendre des mois pour qu’un service informatique fournisse un changement dans une source de données particulière. En réponse, les utilisateurs ont souvent recours à la création de leurs propres datamarts avec des bases de données Access, des fichiers locaux, des sites SharePoint et des feuilles de calcul, ce qui entraîne un manque de gouvernance et de supervision appropriée pour garantir que ces sources de données sont prises en charge et présentent des performances raisonnables.

Les datamarts aident à combler l’écart entre les utilisateurs professionnels et les équipes informatiques. Les datamarts sont des solutions d’analytique en libre-service, permettant aux utilisateurs de stocker et d’explorer les données chargées dans une base de données complètement managée. Les datamarts fournissent une expérience sans code simple et facultative pour ingérer des données à partir de différentes sources de données, effectuer des opérations d’extraction, de transformation et de chargement (ETL, Extract, Transform and Load) sur des données avec Power Query, puis charger celles-ci dans une base de données Azure SQL complètement managée et ne nécessitant aucun paramétrage ou optimisation.

Une fois les données chargées dans un datamart, vous pouvez également définir des relations et des stratégies pour le décisionnel et l’analyse. Les datamarts génèrent automatiquement un modèle sémantique, qui peut être utilisé pour créer des rapports et des tableaux de bord Power BI. Vous pouvez également interroger un datamart avec un point de terminaison T-SQL ou une expérience visuelle.

Diagramme affichant des datamarts et une relation Power BI.

Les datamarts offre les avantages suivants :

  • Les utilisateurs en libre-service peuvent facilement effectuer une analytique de base de données relationnelle, sans avoir besoin d’un administrateur de base de données
  • Les datamarts fournissent une ingestion de données de bout en bout, une préparation et une exploration avec SQL, y compris des expériences sans code
  • Permettent la création de modèles sémantiques et de rapports dans une même expérience holistique

Fonctionnalités des datamarts :

  • 100 % web, aucun autre logiciel n’est requis
  • Expérience sans code aboutissant à un datamart complètement managé
  • Réglage automatique des performances
  • Éditeur de requête SQL et visuelle intégré pour l’analyse ad hoc
  • Prise en charge de SQL et d’autres outils clients populaires
  • Intégration native à Power BI, Microsoft Office et à d’autres offres d’analytique Microsoft
  • Inclus avec les capacités Power BI Premium et Premium par utilisateur

Quand utiliser des datamarts

Les datamarts sont destinés aux charges de travail de données interactives dans le cadre de scénarios en libre-service. Par exemple, si vous travaillez dans la comptabilité ou la finance, vous pouvez créer vos propres modèles de données et collections, que vous pouvez ensuite utiliser pour proposer des questions et réponses métier en libre-service par le biais d’expériences de requête visuelle et T-SQL. En outre, vous pouvez toujours utiliser ces collections de données pour des expériences de création de rapports Power BI plus traditionnelles. Les datamarts sont recommandés pour les clients qui ont besoin d’une propriété et d’une architecture des données décentralisées et orientées domaine, tels que les utilisateurs qui ont besoin de données en tant que produit ou d’une plateforme de données en libre-service.

Les datamarts ont été conçus pour prendre en charge les scénarios suivants :

  • Données en libre-service au niveau d’un département : Centralisez un volume de données petit à modéré (environ 100 Go) dans une base de données SQL complètement managée en libre-service. Les datamarts vous permettent de désigner un magasin unique pour les besoins de création de rapports en aval d’un département en libre-service (par exemple, Excel, rapports Power BI, autres), réduisant ainsi l’infrastructure dans les solutions en libre-service.

  • Analytique de base de données relationnelle avec Power BI : Accédez aux données d’un datamart en utilisant des clients SQL externes. Azure Synapse et d’autres services/outils qui utilisent T-SQL peuvent également utiliser des datamarts dans Power BI.

  • Modèles sémantiques de bout en bout : Permettent aux créateurs Power BI de créer des solutions de bout en bout sans dépendre d’autres outils ou équipes informatiques. Les datamarts passent outre la gestion de l’orchestration entre les flux de données et les modèles sémantiques par le biais de modèles sémantiques générés automatiquement, tout en fournissant des expériences visuelles pour l’interrogation des données et l’analyse ad hoc, le tout reposant sur une base de données Azure SQL.

Le tableau suivant décrit ces offres et les meilleures utilisations pour chacune d’elles, y compris leur rôle avec les datamarts.

Élément Cas d’usage recommandé Rôle complémentaire avec les datamarts
Datamarts Entreposage de données basé sur l’utilisateur et accès SQL à vos données Les datamarts peuvent être utilisés comme sources pour d’autres datamarts ou éléments, avec le point de terminaison SQL :
  • Partage externe
  • Partage entre les limites de département et d’organisation avec la sécurité activée
Dataflows Préparation des données réutilisables (ETL) pour les modèles sémantiques ou les datamarts Les datamarts utilisent un flux de données intégré unique pour l’ETL. Les flux de données peuvent aller plus loin, en permettant :
  • Le chargement de données dans des datamarts avec des planifications d’actualisation différentes
  • Séparation des étapes de préparation des données et d’ETL du stockage, afin qu’elles puissent être réutilisées par des modèles sémantiques
Modèles sémantiques Métriques et couche sémantique pour la création de rapports BI Les datamarts fournissent un modèle sémantique généré automatiquement pour la création de rapports, en activant :
  • La combinaison de données de plusieurs sources
  • Le partage sélectif des tables de datamart pour la création de rapports précis
  • Des modèles composites : modèle sémantique avec des données provenant du datamart et d’autres sources de données en dehors du datamart
  • Modèles proxy : modèle sémantique qui utilise DirectQuery pour le modèle généré automatiquement, avec une seule source de vérité

Intégration des datamarts et des flux de données

Dans certains cas, il peut être utile d’incorporer à la fois des flux de données et des datamarts dans la même solution. L’incorporation de flux de données et de datamarts peut s’avérer avantageuse dans les situations suivantes :

  • Pour les solutions avec des flux de données existants :

    • Consommer facilement les données avec des datamarts pour appliquer toutes les transformations supplémentaires ou activer l’analyse ad hoc et l’interrogation avec des requêtes SQL
    • Facile intégration d’une solution d’entreposage de données sans code et sans gestion de modèles sémantiques
  • Pour les solutions avec des datamarts existants :

    • Effectuer des opérations d’ETL réutilisables à grande échelle pour les grands volumes de données
    • Apporter votre propre lac de données et utiliser des flux de données comme pipeline pour les datamarts

Diagramme montrant les datamarts et les flux de données.

Comparaison des flux de données aux datamarts

Cette section décrit les différences entre les flux de données et les datamarts.

Les flux de données offrent des opérations ETL réutilisables. Les tables ne peuvent pas être parcourues, interrogées ou explorées sans modèle sémantique, mais peuvent être définies en vue d’être réutilisées. Les données sont exposées au format Power BI ou CDM si vous apportez votre propre lac de données. Les flux de données sont utilisés par Power BI pour ingérer des données dans vos datamarts. Vous devez utiliser des flux de données chaque fois que vous souhaitez réutiliser votre logique ETL.

Utilisez des flux de données quand vous devez :

  • Créer une préparation de données réutilisable et partageable pour les éléments dans Power BI.

Les datamarts sont une base de données complètement managée qui vous permet de stocker et d’explorer vos données dans une base de données Azure SQL relationnelle et complètement managée. Les datamarts prennent en charge SQL, un concepteur de requêtes visuelles sans code, la sécurité au niveau des lignes (RLS) et la génération automatique d’un modèle sémantique pour chaque datamart. Vous pouvez effectuer une analyse ad hoc et créer des rapports, le tout sur le web.

Utilisez des datamarts quand vous devez :

  • Trier, filtrer, effectuer une agrégation simple visuellement ou par le biais d’expressions définies en SQL
  • Obtenir des sorties sous forme de résultats, de jeux, de tables et de tables filtrées de données
  • Fournir des données accessibles via un point de terminaison SQL
  • Accepter les utilisateurs qui n’ont pas accès à Power BI Desktop

Cet article a fourni une vue d’ensemble des datamarts et les nombreuses façons dont vous pouvez les utiliser.

Les articles suivants vous permettront d’en savoir plus sur les datamarts et Power BI :

Pour plus d’informations sur les flux de données et la transformation des données, consultez les articles suivants :