Tutoriel Lakehouse : Ingérer des données dans le lakehouse

Dans ce tutoriel, vous allez ingérer des tables de faits et de dimensions supplémentaires à partir de Wide World Importers (WWI) dans le lakehouse.

Important

Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.

Prérequis

Réception de données

Dans cette section, vous utilisez l’activité Copier des données du pipeline Data Factory pour ingérer des exemples de données d’un compte de stockage Azure vers la section Fichiers du lakehouse que vous avez créé précédemment.

  1. Choisissez l’espace de travail que vous avez créé dans le menu volant Espace de travail sur la gauche. Dans le bouton +Nouveau de la page de l’espace de travail, sélectionnez Pipeline de données

    Capture d’écran montrant comment créer un pipeline de données.

  2. Dans la boîte de dialogue Nouveau pipeline , spécifiez le nom IngestDataFromSourceToLakehouse , puis sélectionnez Créer. Un nouveau pipeline de fabrique de données est créé et ouvert.

  3. Dans votre pipeline de fabrique de données nouvellement créé, sélectionnez Ajouter une activité de pipeline pour ajouter une activité au pipeline, puis sélectionnez Copier les données. Cela ajoute l’activité de copie des données au canevas du pipeline.

    Capture d’écran montrant où sélectionner Ajouter une activité de pipeline et Copier des données.

  4. Sélectionnez l’activité de copie de données qui vient d’être ajoutée dans le canevas. Il affiche les propriétés d’activité en bas. Sous l’onglet Général , spécifiez le nom de l’activité de copie de données Copie de données vers Lakehouse.

    Capture d’écran montrant où ajouter le nom de l’activité de copie sous l’onglet Général.

  5. Sous l’onglet Source de l’activité de copie de données sélectionnée, sélectionnez Externe comme type de magasin de données, puis + Nouveau pour créer une connexion à la source de données.

    capture d’écran montrant où sélectionner Externe et + Nouveau sous l’onglet Source.

  6. Pour ce tutoriel, toutes les exemples de données sont disponibles dans un conteneur public de stockage blob Azure. Vous vous connectez à ce conteneur pour copier des données à partir de celui-ci. Dans l’Assistant Nouvelle connexion, sélectionnez Stockage Blob Azure, puis Continuer.

    Capture d’écran de l’Assistant Nouvelle connexion, montrant où sélectionner Stockage Blob Azure.

  7. Dans l’écran suivant de l’Assistant Nouvelle connexion , entrez les détails suivants et sélectionnez Créer pour créer la connexion à la source de données.

    Propriété Valeur
    Nom du compte ou URI https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connexion Créer une connexion
    Nom de la connexion wwisampledata
    Type d’authentification Anonyme

    Capture d’écran de l’écran Paramètres de connexion, montrant où entrer les détails et sélectionner Créer.

  8. Une fois la nouvelle connexion créée, revenez à l’onglet Source de l’activité de copie de données et la connexion nouvellement créée est sélectionnée par défaut. Spécifiez les propriétés suivantes avant de passer aux paramètres de destination.

    Propriété Valeur
    Type de banque de données Externe
    Connexion wwisampledata
    Type de chemin d’accès au fichier Chemins d'accès au fichier
    Chemins d'accès au fichier Nom du conteneur (première zone de texte) : sampledata
    Nom du répertoire (deuxième zone de texte) : WideWorldImportersDW/parquet
    Recursively Activée
    Format de fichier Binaire

    Capture d’écran de l’onglet source montrant où entrer les détails spécifiques.

  9. Sous l’onglet Destination de l’activité de copie de données sélectionnée, spécifiez les propriétés suivantes :

    Propriété Valeur
    Type de banque de données Espace de travail
    Type de magasin de données d’espace de travail Lakehouse
    Lakehouse wwilakehouse
    Dossier racine Fichiers
    Chemins d'accès au fichier Nom du répertoire (première zone de texte) : wwi-raw-data
    Format de fichier Binaire

    Capture d’écran de l’onglet Destination, montrant où entrer des détails spécifiques.

  10. Vous avez maintenant terminé la configuration de l’activité de copie des données. Sélectionnez le bouton Enregistrer sous Accueil pour enregistrer les modifications apportées, puis sélectionnez Exécuter pour exécuter votre pipeline et son activité. Vous pouvez également planifier des pipelines pour actualiser les données à des intervalles définis pour répondre aux besoins de votre entreprise. Pour ce tutoriel, nous n’exécuterons le pipeline qu’une seule fois en cliquant sur le bouton Exécuter .

    Cela déclenche la copie des données de la source de données sous-jacente vers le lakehouse spécifié et peut prendre jusqu’à une minute. Vous pouvez surveiller l’exécution du pipeline et son activité sous l’onglet Sortie , qui s’affiche lorsque vous cliquez n’importe où sur le canevas. Si vous le souhaitez, vous pouvez sélectionner l’icône de lunettes pour examiner les détails du transfert de données.

    Capture d’écran montrant où sélectionner Enregistrer et Exécuter, et où trouver les détails de l’exécution et les lunettes dans l’onglet Sortie.

  11. Une fois les données copiées, accédez à la vue des éléments de l’espace de travail et sélectionnez wwilakehouse pour lancer l’explorateur Lakehouse pour cette lakehouse sélectionnée.

    Capture d’écran montrant où sélectionner le lakehouse pour lancer l’explorateur Lakehouse.

  12. Vérifiez que dans la vue de l’explorateur Lakehouse , un nouveau dossier wwi-raw-data a été créé et que les données de toutes les tables y ont été copiées.

    Capture d’écran montrant que les données sources sont copiées dans l’explorateur Lakehouse.

Étapes suivantes

Passez à l’article suivant pour en savoir plus sur