Configurer et consommer un dataflow

2024-02-02

Avec les dataflows, vous pouvez unifier les données de plusieurs sources et préparer les données unifiées pour la modélisation. Chaque fois que vous créez un flux de données, vous êtes invité à actualiser ses données. L’actualisation d’un flux de données est nécessaire avant de pouvoir le consommer dans un modèle sémantique dans Power BI Desktop ou le référencer en tant que table liée ou calculée.

Remarque

Les flux de données peuvent ne pas être disponibles dans le service Power BI pour tous les utilisateurs U.S. Government DoD. Pour plus d’informations sur les fonctionnalités disponibles et non disponibles, consultez Disponibilité des fonctionnalités Power BI pour les clients U.S. Government.

Configurer un flux de données

Pour configurer l’actualisation d’un flux de données, sélectionnez Plus d’options (points de suspension) et choisissez Paramètres.

Capture d’écran des paramètres de liste déroulante d’un flux de données Power BI.

Les options Paramètres fournissent de nombreuses options pour votre dataflow, comme décrit dans les sections suivantes.

Capture d’écran de la page Paramètres d’un flux de données après avoir sélectionné Paramètres dans la liste déroulante du flux de données.

Se définir comme propriétaire : Si vous n’êtes pas le propriétaire du dataflow, un grand nombre de ces paramètres sont désactivés. Pour prendre possession du dataflow, sélectionnez Prendre le contrôle pour en prendre le contrôle. Vous êtes invité à fournir des informations d’identification prouvant que vous disposez du niveau d’accès nécessaire.
Connexion à la passerelle : Dans cette section, vous pouvez choisir si le dataflow utilise une passerelle, puis sélectionner la passerelle utilisée. Si vous avez spécifié la passerelle dans le cadre de la modification d’un flux de données, lors d’une appropriation, il est possible que vous deviez mettre à jour les informations d’identification à l’aide de l’option modifier le flux de données.
Informations d’identification de la source de données : dans cette section, vous choisissez les informations d’identification qui sont utilisées et vous pouvez modifier la méthode d’authentification auprès de la source de données.
Étiquette de sensibilité : vous pouvez ici définir la confidentialité des données dans le flux de données. Pour en savoir plus sur les étiquettes de confidentialité, consultez le Guide pratique pour appliquer des étiquettes de confidentialité dans Power BI.
Actualisation planifiée : vous pouvez ici définir les heures de la journée à laquelle le flux de données sélectionné est actualisé. Un flux de données peut être actualisé à la même fréquence qu’un modèle sémantique.
Paramètres améliorés du moteur de calcul : vous pouvez ici définir si le flux de données est stocké dans le moteur de calcul. Le moteur de calcul autorise les flux de données suivants, qui font référence à ce flux de données, pour effectuer des fusions et des jointures, ainsi que d’autres transformations plus rapidement. Il permet également l’exécution de DirectQuery sur le dataflow. Le réglage sur Activé garantit que le dataflow est toujours pris en charge en mode DirectQuery, et que les références tirent parti du moteur. Si vous sélectionnez Optimisé, le moteur est utilisé uniquement s’il existe une référence à ce flux de données. La sélection de Désactivé désactive le moteur de calcul et la fonctionnalité DirectQuery pour ce dataflow.
Approbations : vous pouvez définir si le flux de données est certifié ou promu.

Notes

Les utilisateurs disposant d’une licence Pro ou d’une licence Premium par utilisateur (PPU) peuvent créer un flux de données dans un espace de travail Premium.

Attention

Si un espace de travail contenant des flux de données est supprimé, tous les flux de données de cet espace de travail sont également supprimés. Même si la récupération de l’espace de travail est possible, vous ne pouvez pas récupérer les flux de données supprimés, que ce soit directement ou via le support de Microsoft.

Actualiser un flux de données

Les dataflows agissent comme des blocs de construction posés les uns sur les autres. Imaginons que vous disposez d’un flux de données appelé Données brutes et d’une table liée appelée Données transformées qui contient une table liée au flux de données Données brutes. Quand l’actualisation planifiée du flux de données Données brutes se déclenche, cela déclenche tout flux de données qui y fait référence à la fin de l’opération. Cette fonctionnalité crée un effet de chaîne d’actualisations, ce qui vous évite d’avoir à planifier les dataflows manuellement. Voici quelques nuances à prendre en compte lors de l’utilisation des tables liées :

Une table liée est déclenchée par une actualisation uniquement si elle existe dans le même espace de travail.
Une table liée est verrouillée pour la modification si une table source est en cours d’actualisation ou si l’actualisation de la table source est annulée. En cas d’échec de l’actualisation de l’un des dataflows d’une chaîne de référence, tous les dataflows sont restaurés vers les anciennes données (les actualisations de dataflow sont transactionnelles dans un espace de travail).
Seules les tables référencées sont actualisées lorsqu’elles sont déclenchées par une actualisation de la source. Pour planifier toutes les tables, vous devez également définir une actualisation planifiée sur la table liée. Évitez de définir une planification d’actualisation sur les dataflows liés pour éviter une double actualisation.

Les flux de données Annuler l’actualisation prennent en charge la possibilité d’annuler une actualisation, contrairement aux modèles sémantiques. Si une actualisation s’exécute longtemps, vous pouvez sélectionner Plus d’options (points de suspension à côté du flux de données), puis sélectionner Annuler l’actualisation.

Actualisation incrémentielle (Premium uniquement) Les flux de données peuvent également être configurés pour être actualisés de manière incrémentielle. Pour ce faire, sélectionnez le flux de données que vous souhaitez configurer pour l’actualisation incrémentielle, puis choisissez l’icône Actualisation incrémentielle.

Capture d’écran mettant en évidence l’actualisation incrémentielle pour une table.

Le fait de définir l’actualisation incrémentielle a pour effet d’ajouter des paramètres au dataflow pour spécifier la plage de dates. Pour plus d’informations sur la configuration de l’actualisation incrémentielle, consultez Utilisation d’une actualisation incrémentielle avec des flux de données.

Dans certains cas, vous ne devez pas définir l’actualisation incrémentielle :

Les tables liées ne doivent pas utiliser l’actualisation incrémentielle si elles font référence à un flux de données. Les flux de données ne prennent pas en charge le Query Folding (même si DirectQuery est activé pour la table).
Les modèles sémantiques qui font référence à des flux de données ne doivent pas utiliser l’actualisation incrémentielle. Les actualisations des flux de données étant généralement performantes, les actualisations incrémentielles ne devraient pas être nécessaires. Si les actualisations prennent trop de temps, envisagez d’utiliser le moteur de calcul ou le mode DirectQuery.

Consommer un flux de données

Un dataflow peut être consommé des trois façons suivantes :

Créez une table liée à partir du flux de données pour permettre à un autre auteur de flux de données d’utiliser les données.
Créez un modèle sémantique à partir du flux de données pour permettre à un utilisateur d’utiliser les données pour créer des rapports.
Créez une connexion à partir d’outils externes pouvant lire le format CDM (Common Data Model).

Consommer à partir de Power BI Desktop Pour consommer un flux de données, exécutez Power BI Desktop et sélectionnez Flux de données dans la boîte de dialogue Obtenir les données.

Remarque

Le connecteur de flux de données utilise un autre jeu d’informations d’identification que l’utilisateur actuellement connecté. Ce comportement est voulu pour la prise en charge des utilisateurs multi-locataires.

Sélectionnez le dataflow et les tables auxquelles vous souhaitez vous connecter.

Notes

Vous pouvez vous connecter à n’importe quel dataflow ou n’importe quelle table, quel que soit l’espace de travail dans lequel cet élément réside, et qu’il ait été défini dans un espace de travail Premium ou non Premium.

Capture d’écran du Navigateur dans Power BI Desktop avec le choix des flux de données auxquels se connecter.

Si DirectQuery est disponible, vous êtes invité à choisir si vous souhaitez vous connecter aux tables via DirectQuery ou par importation.

En mode DirectQuery, vous pouvez rapidement interroger les modèles sémantiques à grande échelle localement. Toutefois, vous ne pouvez pas effectuer davantage de transformations.

L’utilisation de l’importation pour ajouter des données à Power BI exige que le modèle sémantique soit actualisé indépendamment du flux de données.

Les articles suivants vous permettront d’en savoir plus sur les dataflows et Power BI :

Partager via

Configurer et consommer un dataflow

Configurer un flux de données

Actualiser un flux de données

Consommer un flux de données

Contenu connexe

Commentaires

Ressources supplémentaires