Déterminer quand développer un modèle Importer

Effectué

Un modèle Importer comprend des tables dont la propriété de mode de stockage est définie sur Importer. Il inclut également des tables calculées que vous définissez avec une formule DAX.

Avantages du modèle Importer

Des modèles Importer sont l’infrastructure de modèle la plus fréquemment développée, car elle présente de nombreux avantages. Les modèles Importer :

  • Prennent en charge tous les types de sources de données Power BI, dont les bases de données, les fichiers, les flux, les pages web, les flux de données, etc.
  • Peuvent intégrer des données sources. Par exemple, une table tire ses données d’une base de données relationnelle, tandis qu’une table associée les tire d’une page web.
  • Prennent en charge toutes les fonctionnalités DAX et Power Query (M).
  • Prennent en charge les tables calculées.
  • Fournissent les meilleures performances de requête. En effet, les données mises en cache dans le modèle sont optimisées pour les requêtes analytiques (filtre, groupe et synthèse), et le modèle est stocké entièrement en mémoire.

En bref, les modèles Importer offrent la plupart des options et la flexibilité de conception, et fournissent des performances rapides. Pour cette raison, Power BI Desktop utilise par défaut le mode de stockage Importer lorsque vous « Obtenez des données ».

Diagram shows a star schema import model that loads data from different data source types, including a relational database, an Excel workbook, a social media feed, and a Power B I dataflow.

Limitations du modèle Importer

Malgré les nombreux avantages attrayants, il existe des limitations des modèles Importer que vous devez garder à l’esprit. Les limitations sont liées à la taille du modèle et à l’actualisation des données.

Taille de modèle

Power BI impose des restrictions de taille de jeu de données, qui limitent la taille d’un modèle. Lorsque vous publiez le modèle sur une capacité partagée, il existe une limite de 1 Go par jeu de données. Lorsque cette limite de taille est dépassée, le jeu de données ne parvient pas à s’actualiser. Lorsque vous publiez le modèle sur une capacité dédiée (également appelée capacité Premium), il peut croître au-delà de 10 Go, ce qui vous permet d’activer le Paramètre de format de stockage de jeu de données volumineux pour la capacité.

Vous devriez toujours vous efforcer de réduire la quantité de données stockées dans des tables. Cette stratégie permet de réduire la durée des actualisations du modèle et d’accélérer les requêtes de modèle. Il existe de nombreuses techniques de réduction des données que vous pouvez appliquer, à savoir :

  • Supprimer les colonnes inutiles
  • Supprimer les lignes inutiles
  • Regrouper et résumer pour élever le grain des tables de faits
  • Optimiser les types de données de colonne avec une préférence pour les données numériques
  • Préférence pour les colonnes personnalisées dans Power Query au lieu des colonnes calculées dans le modèle
  • Désactiver le chargement des requêtes Power Query
  • Désactiver la date/heure automatique
  • Utilisez un stockage de table DirectQuery, comme décrit dans des unités ultérieures de ce module.

Pour plus d’informations, consultez Techniques de réduction des données pour la modélisation des importations.

Notes

La limite de 1 Go par jeu de données fait référence à la taille compressée du modèle Power BI, pas au volume des données collectées à partir du système source.

Actualisation des données

Les données importées doivent être actualisées régulièrement. Les données du jeu de données sont aussi actuelles que leur dernière actualisation réussie. Pour maintenir les données à jour, vous configurez une actualisation planifiée des données, ou les consommateurs de rapports peuvent effectuer une actualisation à la demande.

Power BI impose des limites à la fréquence à laquelle les opérations d’actualisation planifiées peuvent se produire. Elle peut atteindre huit fois par jour dans une capacité partagée, et 48 fois par jour dans une capacité dédiée.

Vous devriez déterminer si ce degré de latence est tolérable. Il dépend souvent de la vélocité (ou de la volatilité) des données, ainsi que de l’urgence de tenir les utilisateurs informés de l’état actuel des données. Lorsque les limites d’actualisation planifiée ne sont pas acceptables, envisagez d’utiliser des tables de stockage DirectQuery ou de créer une table hybride. Ou adoptez une approche différente et créez un jeu de données en temps réel à la place.

Conseil

Les tables hybrides sont décrites dans l’unité 4. Pour plus d’informations sur les jeux de données en temps réel, parcourez le module Surveiller les données en temps réel avec Power BI.

Vous devez également envisager d’actualiser la charge de travail et la durée. Par défaut, pour actualiser une table, Power BI supprime toutes les données, puis les recharge. Ces opérations peuvent faire peser une charge inacceptable sur les systèmes sources, en particulier pour des tables de faits volumineuses. Pour réduire cette charge, vous pouvez configurer la fonctionnalité d’actualisation incrémentielle. Une actualisation incrémentielle automatise la création et la gestion de partitions de période de temps, et met à jour intelligemment uniquement les partitions qui nécessitent une actualisation.

Lorsque votre source de données prend en charge l’actualisation incrémentielle, elle peut entraîner des actualisations plus rapides et plus fiables, ainsi qu’une consommation de ressources réduite des systèmes Power BI et sources.

Des modeleurs de données avancés peuvent personnaliser leur propre stratégie de partitionnement. Des scripts d’automatisation peuvent créer, gérer et actualiser des partitions de table. Pour plus d’informations, consultez Scénarios d’utilisation de Power BI : Gestion avancée du modèle de données. Ce scénario d’utilisation décrit l’utilisation du point de terminaison XMLA disponible avec Power BI Premium.