Compréhension des différences entre les types de flux de données

Des flux de données sont utilisés pour extraire, transformer et charger des données dans une destination de stockage où elles peuvent être exploitées pour différents scénarios. Toutes les destinations de stockage ne partageant pas les mêmes caractéristiques, certains comportements et fonctionnalités de flux de données diffèrent en fonction de la destination de stockage dans laquelle le flux de données charge les données. Avant de créer un flux de données, il est important de comprendre comment les données vont être utilisées, et de choisir la destination de stockage en fonction des exigences de votre solution.

La sélection de la destination de stockage d’un flux de données détermine le type de celui-ci. Un flux de données qui charge des données dans des tables Dataverse est classé comme flux de données standard. Les flux de données qui chargent des données dans des tables analytiques sont classés comme flux de données analytiques.

Les flux de données créés dans Power BI sont toujours analytiques. Les flux de données créés dans Power Apps peuvent être standard ou analytiques, selon la sélection que vous opérez lors de leur création.

Flux de données standard

Un flux de données standard charge des données dans des tables Dataverse. Des flux de données standard ne peuvent être créés que dans Power Apps. L’un des avantages de la création de ce type de flux de données est que toute application dépendant de données dans Dataverse peut fonctionner avec les données créées par des flux de données standard. Les applications classiques qui tirent parti des tables Dataverse sont Power Apps, Power Automate, AI Builder et Power Virtual Agents.

Création d’un flux de données standard.

Versions de flux de données standard

Nous avons travaillé sur des mises à jour significatives des flux de données standard afin d’améliorer leurs performances et leur fiabilité. À terme, ces améliorations seront disponibles pour tous les flux de données standard. Toutefois, entre-temps, nous différencierons les flux de données standard existants (version 1) et les nouveaux flux de données standard (version 2) en ajoutant un indicateur de version dans Power Apps.

Versions de flux de données standard.

Comparaison des fonctionnalités des versions de flux de données standard

Le tableau suivant répertorie les principales différences de fonctionnalités entre les flux de données standard V1 et V2, et fournit des informations sur le comportement de chaque fonctionnalité dans chaque version.

Fonctionnalité Standard V1 Standard V2
Nombre maximal de flux de données pouvant être enregistrés avec une planification automatique par client 50 Illimité
Nombre maximal d’enregistrements ingérés par requête/table 500 000 Sans limite. Le nombre maximal d’enregistrements pouvant être ingérés par requête ou table dépend désormais des limites de protection du service Dataverse au moment de l’ingestion.
Vitesse d’ingestion dans Dataverse Performances de base Amélioration des performances par quelques facteurs. Les résultats réels peuvent varier et dépendre des caractéristiques des données ingérées, ainsi que de la charge sur le service Dataverse au moment de l’ingestion.
Stratégie d’actualisation incrémentielle Non pris en charge Prise en charge
Résilience Lorsque les limites de protection du service Dataverse sont rencontrées, un enregistrement est retenté jusqu’à 3 fois. Lorsque les limites de protection du service Dataverse sont rencontrées, un enregistrement est retenté jusqu’à 3 fois.
Intégration de Power Automate Non pris en charge Prise en charge

Flux de données analytiques

Un flux de données analytique charge les données dans des types de stockage optimisés pour l’analytique (Azure Data Lake Storage). Les environnements Microsoft Power Platform et les espaces de travail Power BI fournissent aux clients un emplacement de stockage analytique managé qui est fourni avec les licences de ces produits. En outre, les clients peuvent lier le compte de stockage Azure Data Lake de leur organisation en tant que destination pour les flux de données.

Les flux de données analytiques offrent des fonctionnalités analytiques supplémentaires. Par exemple, l’intégration avec les fonctionnalités d’IA de Power BI ou l’utilisation d’entités calculées qui seront abordées ultérieurement.

Vous pouvez créer des flux de données analytiques dans Power BI. Par défaut, ils chargeront des données dans un stockage managé de Power BI. Toutefois, vous pouvez également configurer Power BI pour stocker les données dans l’Azure Data Lake Storage de l’organisation.

Création d’un flux de données analytique dans Power BI.

Vous pouvez également créer des flux de données analytiques dans les portails Power Apps et Dynamics 365 Customer Insights. Lorsque vous créez un flux de données dans le portail Power Apps, vous pouvez choisir entre le stockage analytique managé Dataverse ou le compte Azure Data Lake Storage de votre organisation.

Création d’un flux de données analytique dans Power Platform.

Intégration d’IA

Parfois, selon le besoin, il se peut que vous deviez appliquer certaines fonctions d’IA et d’apprentissage automatique aux données via le flux de données. Ces fonctionnalités disponibles dans des flux de données Power BI nécessitent un espace de travail Premium.

Insights d’IA dans un flux de données analytique.

Les articles suivants expliquent comment utiliser des fonctions d’IA dans un flux de données :

Notez que les fonctionnalités répertoriées ci-dessus sont spécifiques de Power BI et ne sont pas disponibles lors de la création d’un flux de données dans les portails Power Apps ou Dynamics 365 Customer Insights.

Tables calculées

L’une des raisons d’utiliser une table calculée est la capacité de traiter de grandes quantités de données. La table calculée aide dans ces scénarios. Si vous avez une table dans un flux de données et qu’une autre table du même flux de données utilise la sortie de la première table, cette action crée une table calculée.

La table calculée facilite les performances des transformations de données. Au lieu de refaire plusieurs fois les transformations nécessaires dans la première table, la transformation n’est effectuée qu’une seule fois dans la table calculée. Ensuite, le résultat est utilisé plusieurs fois dans d’autres tables.

Table calculée dans un flux de données analytique.

Pour en savoir plus sur les tables calculées, accédez à Création de tables calculées dans des flux de données.

Les tables calculées ne sont disponibles que dans un flux de données analytiques.

Flux de données standard et analytique

Le tableau suivant répertorie certaines différences entre une table standard et une table analytique.

Opération Standard Analytique
Guide pratique pour créer Dataflows Power Platform Dataflows Power BI
Flux de données Power Platform en cochant la case Entités analytiques uniquement lors de la création du flux de données
Options de stockage Dataverse Stockage Azure Data Lake fourni par Power BI pour les flux de données Power BI, stockage Azure Data Lake fourni par Dataverse pour les flux de données Power Platform, ou stockage Azure Data Lake fourni par le client
Transformations Power Query Oui Oui
Fonctions IA Non Oui
Table calculée Non Oui
Peut être utilisée dans d’autres applications Oui, via Dataverse Flux de données Power BI : uniquement dans Power BI
Flux de données Power Platform ou flux de données externes Power BI : oui, via Azure Data Lake Storage
Mappage à la table standard Oui Oui
Chargement incrémentiel Chargement incrémentiel par défaut
Possibilité de modifier l’utilisation de la case à cocher Supprimer les lignes qui n’existent plus dans la sortie de requête au niveau des paramètres de chargement
Charge complète par défaut
Possibilité de configurer une actualisation incrémentielle en la définissant dans les paramètres du flux de données
Actualisation planifiée Oui Oui, possibilité de notifier les propriétaires de flux de données en cas de défaillance

Scénarios d’utilisation de chaque type de flux de données

Voici des exemples de scénarios et de meilleures pratiques recommandées pour chaque type de flux de données.

Utilisation multiplateforme : flux de données standard

Si votre plan de création de flux de données consiste à utiliser des données stockées dans plusieurs plateformes (non seulement Power BI, mais aussi d’autres services Microsoft Power Platform, Dynamics 365, etc.), un flux de données standard est un excellent choix. Les flux de données standard stockent les données dans Dataverse, auxquelles vous pouvez accéder via un grand nombre d’autres plateformes et services.

Transformations de données lourdes sur des tables de données volumineuses : flux de données analytique

Les flux de données analytiques constituent une excellente option pour traiter de grandes quantités de données. Les flux de données analytiques améliorent également la puissance de calcul derrière la transformation. Le fait que les données soient stockées dans Azure Data Lake Storage augmente la vitesse d’écriture dans une destination. Par rapport à Dataverse (qui peut avoir de nombreuses règles à vérifier lors du stockage des données), Azure Data Lake Storage est plus rapide pour les transactions de lecture/écriture sur une grande quantité de données.

Fonctionnalités d’IA : flux de données analytique

Si vous prévoyez d’utiliser une fonctionnalité d’IA par le biais de l’étape de transformation des données, il est utile d’utiliser un flux de données analytique car il permet d’utiliser toutes les fonctionnalités d’IA prises en charge.