Mapper les données dans Azure Synapse Analytics

Article
06/01/2023

Qu’est-ce que l’outil Mapper les données ?

L’outil Mapper les données est un processus guidé qui aide les utilisateurs à créer des mappages ETL et des flux de données de mappage depuis leurs données sources vers des tables de bases de données de lac Synapse sans écrire de code. Ce processus commence par le choix des tables de destination par l’utilisateur dans les bases de données de lac Synapse, puis se poursuit par leur mappage à leurs données sources dans ces tables.

Pour plus d’informations sur les bases de données de lac Synapse, consultez Vue d’ensemble des modèles de base de données Azure Synapse – Azure Synapse Analytics | Microsoft Docs

L’outil Mapper les données offre une expérience guidée qui permet à l’utilisateur de générer un flux de données de mappage sans avoir à démarrer avec un canevas vide. Vous pouvez ensuite générer rapidement un exécutable de flux de données de mappage évolutif dans les pipelines Synapse.

Prise en main

L’outil Mapper les données se démarre à partir de l’expérience de base de données de lac Synapse. À partir de là, vous pouvez sélectionner l’outil Mapper les données pour commencer le processus.

Capture d’écran montrant comment ouvrir l’outil Mapper les données.

L’outil Mapper les données a besoin du calcul disponible pour aider les utilisateurs à prévisualiser des données et à lire le schéma de leurs fichiers sources. Lors de la première utilisation de l’outil Mapper les données dans une session, vous avez besoin d’initialiser un cluster. Capture d’écran montrant les clusters de débogage.

Pour commencer, choisissez la source de données à mapper à vos tables de base de données de lac. Les sources de données actuellement prises en charge sont les bases de données de lac Azure Data Lake Storage Gen 2 et Synapse. Capture d’écran montrant les sources.

Options de type de fichier

Quand vous choisissez un magasin de fichiers comme Azure Data Lake Storage Gen 2, les types de fichiers suivants sont pris en charge :

Common Data Model
Texte délimité
Parquet

Créer un mappage de données

Configurez votre mappage de données avec le type de source que vous avez sélectionné. Capture d’écran des paramètres de configuration des fichiers de données de mappage.

Notes

Vous pouvez choisir un dossier ou un seul fichier. Si vous choisissez un dossier, vous pourrez mapper plusieurs fichiers à vos tables de base de données Lake. Si vous choisissez un dossier, vous êtes également invité, après avoir sélectionné continuer, à n'inclure que des fichiers spécifiques, si vous le souhaitez.

Nommez votre mappage de données et sélectionnez la destination de la base de données de lac Synapse. Capture d’écran montrant le nommage et la destination.

Mappage de la source à la cible

Choisissez une table source principale à mapper à la table de destination de la base de données de lac Synapse. Capture d’écran montrant les règles de l’outil Mapper les données.

Nouveau mappage

Utilisez le bouton Nouveau mappage pour ajouter une méthode de mappage permettant de créer un mappage ou une transformation.

Source supplémentaire

Utilisez le bouton Source supplémentaire pour rejoindre et ajouter une autre source à votre mappage.

Aperçu des données

L’onglet Aperçu des données vous donne une capture instantanée interactive des données de chaque transformation. Pour en savoir plus, consultez Aperçu des données en mode de débogage.

Méthodes de mappage

Les méthodes de mappage suivantes sont prises en charge :

Direct
Clé de substitution
Lookup
Supprimer le tableau croisé dynamique
Agrégat
- Sum
- Minimum
- Maximale
- Premier
- Dernier
- Écart type
- Moyenne
- Moyenne
Colonne dérivée
- SupprEspace
- Upper
- Moins grand
- Avancé

Création d’un pipeline

Une fois que vous avez terminé vos transformations avec l’outil Mapper les données, sélectionnez le bouton Créer un pipeline pour générer un flux de données de mappage et un pipeline afin de déboguer et exécuter votre transformation.

Partager via