Partage via


Vue d’ensemble des sources de données

Pour configurer Dynamics 365 Customer Insights - Data, commencez par importer les données sources à traiter. Customer Insights - Data fournit plusieurs types de connecteurs de données à Connecter pour ingérer et ingérer des données provenant d’un large ensemble de sources.

Cet article décrit les options qui peuvent affecter les performances d’ingestion de données.

Format delta

Le format de données Delta est le format de traitement natif utilisé par Customer Insights - Data. Si vous pouvez fournir des données sources au format Delta, les avantages sont nombreux.

  • Meilleure efficacité avec Customer Insights - Data : le format Delta est utilisé en interne par Customer Insights - Data.
  • Ingestion de données plus rapide : le format Delta offre une compression supérieure pour des transferts de données plus rapides.
  • Unification plus rapide : avec la fonctionnalité de voyage dans le temps Delta, Customer Insights - Data unifie uniquement les données modifiées plutôt que de retraiter l’ensemble des données. L’unification incrémentielle nécessite que toutes les entrées de données soient au format Delta.
  • Réduction des problèmes de corruption de données : réduit les partitions corrompues et les problèmes courants de corruption de données causés par des formats plus anciens tels que CSV.
  • Conception Gestion des données plus fiable : le format Delta ne nécessite pas de mises à jour manuelles des manifestes, des schémas et des fichiers de partition.
  • Validité des données plus élevée : le format Delta fournit des transactions d’atomicité, de cohérence, d’isolation, de durabilité (ACID) et d’isolement dans Spark.

Vous pouvez utiliser format delta avec connecteurs suivants :

Delta est un terme introduit avec Delta Lake, la base de stockage des données et des tables dans la plateforme Databricks Lakehouse. Delta Lake désigne une couche de stockage open source qui apporte des transactions ACID (atomicité, cohérence, isolation et durabilité) aux charges de travail Big Data. Pour plus d’informations, consultez la page de documentation Delta Lake.

Joindre la source de données en pièce jointe ou l’importer

Une considération clé lors du choix de la manière d’ingérer vos données est de savoir si le connecteur s’attache aux données ou en fait des copies. Customer Insights - Data recommande de joindre des données aux données, car celles-ci sont directement accessibles lorsqu’il est temps de les traiter. La copie des données entraîne des retards lors de la mise à jour des données.

Les connecteurs de données suivants s’attachent à vos données.

Si vous ne pouvez pas utiliser l’un des connecteurs associés, copiez les données avec l’un des Power Query connecteurs. Power Query fournit un moyen utile de transformer les données.

Profilage des données

Lorsque les données sont ingérées, Customer Insights - Data effectue un profilage de données de base tel que la fréquence des valeurs répétées dans une colonne. Vous pouvez utiliser les données de profil pour comprendre vos données et résoudre les problèmes. Par exemple, si vous effectuez une correspondance sur la colonne FullName, le profil de données peut vous aider à détecter qu’une valeur par défaut de "Entrez votre nom" apparaît sur 10 000 lignes. La correspondance avec cette valeur entraînerait la correspondance de 10 000 lignes, ce qui ne devrait pas être le cas. Vous pouvez activer le profilage des données pour davantage de colonnes lorsque vous ajoutez vos tables Azure Data Lake, Delta ou Azure Synapse les sources de données.

Après avoir ingéré les données, affichez les résultats du profilage des données :

Accédez à Données>Tables et sélectionnez une table. Sélectionnez l’icône Résumé pour un champ, tel que DateOfBirth.

Page de tableaux affichant l’icône Résumé mise en évidence sur DateOfBirth.

Affichez les détails des erreurs ou des valeurs manquantes.

Graphique récapitulatif pour DateOfBirth.

Page Sources de données

La page Source de données répertorie les sources de données en deux sections :

  • Géré par moi : flux de données Power Platform créés et gérés que par vous. Les autres utilisateurs peuvent uniquement visualiser ces flux de données, mais pas les modifier, les actualiser ou les supprimer.
  • Géré par d’autres : flux de données Power Platform créés par d’autres administrateurs. Vous ne pouvez que les visualiser. Elle répertorie le propriétaire du flux de données à contacter pour obtenir de l’aide.

Note

Toutes les tables peuvent être visualisées et utilisées par d’autres utilisateurs. Alors que les sources de données appartiennent à l’utilisateur qui les a créées, les tables résultant de l’ingestion de données peuvent être utilisées par chaque utilisateur de Customer Insights - Data.

Capture d’écran de l'écran Sources de données.

Étapes suivantes