Meilleures pratiques pour réutiliser les flux de données entre les environnements et les espaces de travail

Cet article décrit une collection de bonnes pratiques pour réutiliser efficacement et efficacement les flux de données. Lisez cet article pour éviter les pièges de conception et les problèmes de performances potentiels lorsque vous développez des dataflows à des fins de réutilisation.

Séparer les dataflows de transformation de données des flux de données intermédiaires/d’extraction

Si un dataflow effectue toutes les actions, il est difficile de réutiliser ses tables dans d’autres dataflows ou à d’autres fins. Les meilleurs dataflows à réutiliser sont ces dataflows qui effectuent seulement quelques actions. La création de dataflows spécialisés dans une tâche spécifique est l’une des meilleures façons de les réutiliser. Si vous avez un ensemble de dataflows que vous utilisez comme dataflows intermédiaires, leur seule action consiste à extraire des données as-is du système source. Ces dataflows peuvent être réutilisés dans plusieurs autres dataflows.

Si vous avez des dataflows de transformation de données, vous pouvez les fractionner en dataflows qui effectuent des transformations courantes. Chaque dataflow peut effectuer quelques actions. Ces quelques actions par dataflow garantissent que la sortie de ce flux de données est réutilisable par d’autres dataflows.

Dataflow ne faisant que quelques actions.

Utiliser plusieurs espaces de travail

Chaque espace de travail (ou environnement) est disponible uniquement pour les membres de cet espace de travail. Si vous générez tous vos flux de données dans un espace de travail, vous réduisez la réutilisation de vos dataflows. Vous pouvez disposer d’espaces de travail génériques pour les dataflows qui traitent des tables à l’échelle de l’entreprise. Vous pouvez également disposer d’un espace de travail pour que les flux de données traitent des tables entre plusieurs services. Vous pouvez également disposer d’espaces de travail pour que les flux de données soient utilisés uniquement dans des services spécifiques.

Image montrant les espaces de travail distincts.

Définir les niveaux d’accès corrects sur les espaces de travail

Pour accorder l’accès aux dataflows dans d’autres espaces de travail pour utiliser la sortie d’un flux de données dans un espace de travail, vous devez simplement leur accorder l’accès Affichage dans l’espace de travail. Pour en savoir plus sur d’autres rôles dans un espace de travail Power BI, accédez aux rôles dans les nouveaux espaces de travail.

Capture d’écran montrant comment accéder à l’espace de travail Power BI.

Approbation sur le flux de données dans Power BI

Il peut y avoir de nombreux dataflows créés dans une organisation cliente, et il peut être difficile pour les utilisateurs de savoir quel flux de données est le plus fiable. Les auteurs d’un flux de données, ou ceux qui ont un accès en modification, peuvent approuver le flux de données à trois niveaux : aucune approbation, promotion ou certification.

Ces niveaux d’approbation aident les utilisateurs à trouver des flux de données fiables plus faciles et plus rapides. Le flux de données avec un niveau d’approbation supérieur apparaît en premier. L’administrateur Power BI peut déléguer la possibilité d’approuver des flux de données au niveau certifié à d’autres personnes. Plus d’informations : Approbation - Promotion et certification du contenu Power BI

Séparer les tables dans plusieurs dataflows

Vous pouvez avoir plusieurs tables dans un dataflow. L’une des raisons pour lesquelles vous pouvez fractionner des tables dans plusieurs dataflows est ce que vous avez appris précédemment dans cet article sur la séparation des flux de données d’ingestion et de transformation de données. Une autre bonne raison d’avoir des tables dans plusieurs dataflows est quand vous souhaitez une planification d’actualisation différente de celle d’autres tables.

Dans l’exemple illustré dans l’image suivante, la table des ventes doit être actualisée toutes les quatre heures. La table de dates doit être actualisée une seule fois par jour pour conserver l’enregistrement de date actuel mis à jour. Et une table de mappage de produit doit simplement être actualisée une fois par semaine. Si vous avez toutes ces tables dans un flux de données, vous n’avez qu’une seule option d’actualisation pour toutes ces tables. Toutefois, si vous fractionnez ces tables en plusieurs dataflows, vous pouvez planifier l’actualisation de chaque dataflow séparément.

Image montrant des dataflows avec des planifications différentes pour l’actualisation.

Bonnes tables candidates pour les tables de flux de données

Lorsque vous développez des solutions à l’aide de Power Query dans les outils de bureau, vous pouvez vous demander ; Parmi ces tables, quels sont les bons candidats à déplacer vers un dataflow ? Les meilleures tables à déplacer vers le flux de données sont celles qui doivent être utilisées dans plusieurs solutions, ou plusieurs environnements ou services. Par exemple, le tableau Date indiqué dans l’image suivante doit être utilisé dans deux fichiers Power BI distincts. Au lieu de dupliquer cette table dans chaque fichier, vous pouvez générer la table dans un flux de données en tant que table et la réutiliser dans ces fichiers Power BI.

Image montrant une table partagée utilisée dans un dataflow.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2025-08-15