Partager via


Démarrage rapide : créer votre premier pipeline pour copier des données

Dans ce guide de démarrage rapide, vous allez générer un pipeline de données pour déplacer un exemple de jeu de données vers le Lakehouse. Cette expérience vous montre une démonstration rapide sur l’utilisation de l’activité de copie de pipeline et sur le chargement de données dans Lakehouse.

Prérequis

Pour commencer, vous devez remplir les conditions préalables suivantes :

Créer un pipeline de données

  1. Accédez à Power BI.

  2. Sélectionnez l’icône Power BI en bas à gauche de l’écran, puis Data Factory pour ouvrir la page d’accueil de Data Factory.

    Capture d’écran avec l’expérience Data Factory mise en avant.

  3. Accédez à votre espace de travail Microsoft Fabric. Si vous avez créé un espace de travail dans la section Prérequis précédente, utilisez celui-ci.

    Capture d’écran de la fenêtre Espaces de travail à partir de laquelle vous accédez à votre espace de travail.

  4. Sélectionnez Pipeline de données, puis entrez un nom de pipeline pour créer un pipeline.

    Capture d’écran du bouton du nouveau pipeline dans l’espace de travail récemment créé.Capture d’écran du nom du pipeline en cours de création.

Copier des données à l’aide d’un pipeline

Dans cette session, vous commencez à générer votre premier pipeline en suivant les étapes ci-dessous sur la copie depuis un exemple de jeu de données fourni par le pipeline dans Lakehouse.

Étape 1 : commencer avec l’Assistant pour copier des données

  1. Après avoir sélectionné Assistant pour copier des données sur le canevas, l’outil Assistant de copie est ouvert pour démarrer.

    Capture d’écran du bouton Copier des données.

Étape 2 : configurer votre source

  1. Choisissez l’onglet Exemples de données en haut de la page du navigateur de source de données, puis sélectionnez les exemples de données Jours fériés, puis Suivant.

    Capture d'écran de la page Choisir la source de données de l’assistant Copier des données avec l’exemple de données Jours fériés sélectionné.

  2. À la page Se connecter à la source de données du assistant, l’aperçu de l’exemple de données jours fériés s’affiche. Cliquez alors sur Suivant.

    Capture d’écran de l’exemple de données Jours fériés.

Étape 3 : configurer votre destination

  1. Sélectionnez Lakehouse, puis Suivant.

    Capture d'écran de la sélection d'une destination Lakehouse dans l'assistant Copier des données.

  2. Entrez un nom de lakehouse, puis sélectionnez Créer et connecter.

    Capture d’écran du bouton Créer un Lakehouse sélectionnez sur la page Choisir la destination des données de l’assistant Copier des données.

  3. Configurez, puis mappez vos données sources sur la table Lakehouse de destination. Sélectionnez Tables pour le dossier racine et Charger dans une nouvelle table pour Paramètres de chargement. Indiquez un nom de table et sélectionnez Suivant.

    Capture d’écran de la page Se connecter à la destination des données de l’assistant Copier des données avec l’option Tables sélectionnée et un nom de table pour l’exemple de données fourni.

Étape 4 : vérifier et créer votre activité Copy

  1. Passez en revue vos paramètres d’activité Copy dans les étapes précédentes, puis sélectionnez Enregistrer + Exécuter pour terminer. Vous pouvez également revenir sur les étapes précédentes de l’outil pour modifier vos paramètres, si nécessaire. Si vous souhaitez simplement enregistrer, mais pas exécuter le pipeline, vous pouvez décocher immédiatement la case Démarrer le transfert de données immédiatement.

    Capture d’écran de la page Vérifier + créer de l’assistant de copie de données avec la source et la destination mises en évidence.

  2. L’activité Copy est ajoutée à votre nouveau canevas de pipeline de données. Tous les paramètres, y compris les paramètres avancés pour l’activité, sont disponibles dans les onglets situés sous le canevas du pipeline lorsque l’activité Copier les données créée est sélectionnée.

    Capture d’écran de l’activité Copy terminée avec les onglets de paramètres de l’activité Copy mis en évidence.

Exécuter et planifier votre pipeline de données

  1. Si vous n’avez pas choisi d’enregistrer Enregistrer + Exécuter sur la page Vérifier + enregistrer de l’Assistant pour copier des données, basculez vers l’onglet Accueil et sélectionnez Exécuter. Une boîte de dialogue de confirmation s’affiche. Sélectionnez ensuite Enregistrer et exécuter pour démarrer l’activité.

    Capture d’écran du bouton Exécuter sous l’onglet Accueil avec l’invite Enregistrer et exécuter.

  2. Vous pouvez superviser le processus en cours d’exécution, puis vérifier les résultats sous l’onglet Sortie sous le canevas du pipeline. Sélectionnez le lien correspondant au nom de l’activité dans votre sortie pour afficher les détails de l’exécution.

    Capture d’écran de l’onglet Sortie de l’exécution de pipeline en cours avec le bouton Détails mis en évidence dans l’état de l’exécution.

  3. Les détails de l’exécution indiquent la quantité de données lues et écrites, ainsi que divers autres détails sur l’exécution.

    Capture d’écran de la fenêtre Détails de l’exécution.

  4. Vous pouvez également planifier l’exécution du pipeline avec une fréquence spécifique si nécessaire. Voici un exemple de planification de l’exécution du pipeline toutes les 15 minutes.

    Capture d’écran de la boîte de dialogue Planifier pour le pipeline avec une planification périodique de 15 minutes.

Le pipeline de cet exemple montre comment copier des exemples de données vers Lakehouse. Vous avez appris à :

  • Créer un pipeline de données.
  • Copiez des données avec l’assistant de copie.
  • Exécutez et planifiez votre pipeline de données.

Ensuite, avancez pour en savoir plus sur la surveillance des exécutions de votre pipeline.