Partager via


Module 1 : Créer un pipeline avec Data Factory

Ce module prend environ 10 minutes. Vous allez ingérer des données brutes de la source de données dans une table dans la couche de données bronze d'un Data Lakehouse à l'aide de l'activité de copie dans un pipeline de données.

Les étapes générales du module 1 sont les suivantes :

  1. Créez un pipeline de données.
  2. Créez une activité de copie dans le pipeline pour charger des exemples de données dans un data Lakehouse.
  3. Exécuter et afficher les résultats de l’activité de copie

Conditions préalables

Créer un pipeline de données

  1. Connectez-vous à Power BI.

  2. Sélectionnez l’icône Power BI par défaut en bas à gauche de l’écran, puis sélectionnez Fabric.

    Capture d'écran montrant la sélection de l'expérience Data Factory.

  3. Sélectionnez un espace de travail sous l’onglet Espaces de travail, puis sélectionnez + Nouvel élément, puis choisissez pipeline de données.

    Capture d’écran de la page de démarrage de Data Factory avec le bouton pour créer un pipeline de données sélectionné.

  4. Fournissez un nom de pipeline. Sélectionnez ensuite Créer.

    Capture d’écran montrant la boîte de dialogue pour donner un nom au nouveau pipeline.

Créer une activité de copie dans le pipeline pour charger des exemples de données dans un data Lakehouse

  1. Sélectionnez Assistant de copie de données pour ouvrir l’outil de l’assistant de copie.

    Capture d’écran montrant la sélection de l’activité Copier des données à partir de la nouvelle page de démarrage du pipeline.

  2. Dans la page Choisir une source de données , sélectionnez Exemples de données dans les options situées en haut de la boîte de dialogue, puis sélectionnez NyC Taxi - Vert.

    Capture d’écran montrant la sélection des données NYC Taxi - Vert dans l'assistant de copie sous l’onglet Choisir une source de données.

  3. L’aperçu de la source de données apparaît ensuite sur la page Se connecter à la source de données. Révisez, puis sélectionnez suivant.

    Capture d’écran montrant les données d’aperçu pour l’exemple de jeu de données NYC Taxi - Green.

  4. Pour l’étape Choisir la destination des données de l’Assistant copie, sélectionnez Lakehouse.

    Capture d’écran montrant la sélection de la destination Lakehouse sous l’onglet Choisir la destination des données de l’Assistant Copie de données.

  5. Entrez un nom Lakehouse, puis sélectionnez Créer et se connecter.

    Capture d’écran montrant la page de configuration de la destination des données de l’assistant de copie, lors du choix de l’option Créer un nouveau Lakehouse et en fournissant un nom pour le Lakehouse.

  6. Sélectionnez Tables pour le dossier racine et chargez-les vers une nouvelle table pour les paramètres de chargement. Fournissez un nom de table (dans notre exemple, nous l’avons nommé Bronze) et sélectionnez Suivant.

    Capture d’écran montrant l’onglet Se connecter à la destination des données de l’Assistant Copier des données, à l’étape Sélectionner et mapper au chemin d’accès au dossier ou à la table.

  7. Enfin, dans la page Vérifier + enregistrer de l’assistant de copie des données, passez en revue la configuration. Pour ce didacticiel, décochez la case à cocher Démarrer le transfert des données immédiatement, car nous exécutons l’opération manuellement à l’étape suivante. Sélectionnez ensuite OK.

    Capture d’écran montrant l’Assistant Copier des données dans la page Vérifier + enregistrer.

Exécuter et afficher les résultats de votre activité de copie

  1. Sélectionnez l’onglet Exécuter dans l’éditeur de pipeline. Sélectionnez ensuite le bouton Exécuter , puis Enregistrez et exécutez pour exécuter l’activité Copier.

    Capture d’écran montrant l’onglet Exécution du pipeline avec le bouton Exécuter mis en surbrillance.

    Capture d’écran montrant la boîte de dialogue Enregistrer et exécuter avec le bouton Enregistrer et exécuter mis en surbrillance.

  2. Vous pouvez superviser l’exécution, puis vérifier les résultats sous l’onglet Sortie sous le canevas du pipeline. Sélectionnez le nom du pipeline pour afficher les détails de l’exécution.

    Capture d’écran montrant le bouton Détails d'exécution sous l’onglet Sortie du pipeline.

  3. Les détails de l’exécution montrent 1 508 501 lignes lues et écrites.

    Capture d’écran des détails de copie des données pour l’exécution du pipeline.

  4. Développez la section Répartition des durées pour afficher la durée de chaque étape de l’activité Copy. Après avoir examiné les détails de la copie, sélectionnez Fermer.

    Capture d’écran montrant la répartition de la durée de l’exécution de l’activité Copy.

Étape suivante

Passez à la section suivante pour créer votre dataflow.