Tutoriel Lakehouse : Ingérer des données dans le lakehouse
Dans ce tutoriel, vous allez ingérer des tables de faits et de dimensions supplémentaires à partir de Wide World Importers (WWI) dans le lakehouse.
Important
Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.
Prérequis
Réception de données
Dans cette section, vous utilisez l’activité Copier des données du pipeline Data Factory pour ingérer des exemples de données d’un compte de stockage Azure vers la section Fichiers du lakehouse que vous avez créé précédemment.
Choisissez l’espace de travail que vous avez créé dans le menu volant Espace de travail sur la gauche. Dans le bouton +Nouveau de la page de l’espace de travail, sélectionnez Pipeline de données
Dans la boîte de dialogue Nouveau pipeline , spécifiez le nom IngestDataFromSourceToLakehouse , puis sélectionnez Créer. Un nouveau pipeline de fabrique de données est créé et ouvert.
Dans votre pipeline de fabrique de données nouvellement créé, sélectionnez Ajouter une activité de pipeline pour ajouter une activité au pipeline, puis sélectionnez Copier les données. Cela ajoute l’activité de copie des données au canevas du pipeline.
Sélectionnez l’activité de copie de données qui vient d’être ajoutée dans le canevas. Il affiche les propriétés d’activité en bas. Sous l’onglet Général , spécifiez le nom de l’activité de copie de données Copie de données vers Lakehouse.
Sous l’onglet Source de l’activité de copie de données sélectionnée, sélectionnez Externe comme type de magasin de données, puis + Nouveau pour créer une connexion à la source de données.
Pour ce tutoriel, toutes les exemples de données sont disponibles dans un conteneur public de stockage blob Azure. Vous vous connectez à ce conteneur pour copier des données à partir de celui-ci. Dans l’Assistant Nouvelle connexion, sélectionnez Stockage Blob Azure, puis Continuer.
Dans l’écran suivant de l’Assistant Nouvelle connexion , entrez les détails suivants et sélectionnez Créer pour créer la connexion à la source de données.
Propriété Valeur Nom du compte ou URI https://azuresynapsestorage.blob.core.windows.net/sampledata
Connexion Créer une connexion Nom de la connexion wwisampledata Type d’authentification Anonyme Une fois la nouvelle connexion créée, revenez à l’onglet Source de l’activité de copie de données et la connexion nouvellement créée est sélectionnée par défaut. Spécifiez les propriétés suivantes avant de passer aux paramètres de destination.
Propriété Valeur Type de banque de données Externe Connexion wwisampledata Type de chemin d’accès au fichier Chemins d'accès au fichier Chemins d'accès au fichier Nom du conteneur (première zone de texte) : sampledata
Nom du répertoire (deuxième zone de texte) : WideWorldImportersDW/parquetRecursively Activée Format de fichier Binaire Sous l’onglet Destination de l’activité de copie de données sélectionnée, spécifiez les propriétés suivantes :
Propriété Valeur Type de banque de données Espace de travail Type de magasin de données d’espace de travail Lakehouse Lakehouse wwilakehouse Dossier racine Fichiers Chemins d'accès au fichier Nom du répertoire (première zone de texte) : wwi-raw-data Format de fichier Binaire Vous avez maintenant terminé la configuration de l’activité de copie des données. Sélectionnez le bouton Enregistrer sous Accueil pour enregistrer les modifications apportées, puis sélectionnez Exécuter pour exécuter votre pipeline et son activité. Vous pouvez également planifier des pipelines pour actualiser les données à des intervalles définis pour répondre aux besoins de votre entreprise. Pour ce tutoriel, nous n’exécuterons le pipeline qu’une seule fois en cliquant sur le bouton Exécuter .
Cela déclenche la copie des données de la source de données sous-jacente vers le lakehouse spécifié et peut prendre jusqu’à une minute. Vous pouvez surveiller l’exécution du pipeline et son activité sous l’onglet Sortie , qui s’affiche lorsque vous cliquez n’importe où sur le canevas. Si vous le souhaitez, vous pouvez sélectionner l’icône de lunettes pour examiner les détails du transfert de données.
Une fois les données copiées, accédez à la vue des éléments de l’espace de travail et sélectionnez wwilakehouse pour lancer l’explorateur Lakehouse pour cette lakehouse sélectionnée.
Vérifiez que dans la vue de l’explorateur Lakehouse , un nouveau dossier wwi-raw-data a été créé et que les données de toutes les tables y ont été copiées.
Étapes suivantes
Passez à l’article suivant pour en savoir plus sur