Tutoriel : Analyser des données avec un notebook
S’applique à : point de terminaison d’analytique SQL et Warehouse dans Microsoft Fabric
Dans ce tutoriel, découvrez comment enregistrer vos données une fois, puis les utiliser avec de nombreux autres services. Des raccourcis peuvent également être créés vers les données stockées dans Azure Data Lake Storage et S3 pour vous permettre d’accéder directement aux tables delta à partir de systèmes externes.
Créer un lakehouse.
Nous créons au préalable un lakehouse. Pour créer un lakehouse dans votre espace de travail Microsoft Fabric :
Sélectionnez l’espace de travail
Data Warehouse Tutorial
dans le menu de navigation.Sélectionnez + Nouveau>Lakehouse.
Dans le champ Nom, entrez
ShortcutExercise
et sélectionnez Créer.Le nouveau lakehouse se charge et la vue Explorer s’ouvre, avec le menu Obtenir des données dans votre lakehouse. Sous Charger des données dans votre lakehouse, sélectionnez le bouton Nouveau raccourci.
Dans la fenêtre Nouveau raccourci, sélectionnez le bouton correspondant à Microsoft OneLake.
Dans la fenêtre Sélectionner un type de source de données, faites défiler la liste jusqu’à trouver l’Entrepôt nommé
WideWorldImporters
créé précédemment. Sélectionnez-le, puis Suivant.Dans l’explorateur d’objets OneLake, développez Tables, puis le schéma
dbo
et sélectionnez la case d’option à côté dedimension_customer
. Cliquez sur le bouton Créer.Si vous voyez un dossier appelé
Unidentified
sous Tables, sélectionnez l’icône Actualiser dans la barre du menu horizontale.Sélectionnez le
dimension_customer
dans la liste Table pour afficher un aperçu des données. Le lakehouse affiche les données de la tabledimension_customer
de l’entrepôt !Ensuite, créez un notebook pour interroger la table
dimension_customer
. Dans le ruban Accueil, sélectionnez la liste déroulante Ouvrir un notebook, puis choisissez Nouveau notebook.Sélectionnez, puis faites glisser le
dimension_customer
à partir de la liste Tables dans la cellule ouverte du notebook. Vous pouvez voir qu’une requête PySpark a été écrite pour vous permettre d’interroger toutes les données à partir deShortcutExercise.dimension_customer
. Cette expérience de notebook est semblable à l’expérience de notebook Jupyter de Visual Studio Code. Vous pouvez également ouvrir le notebook dans VS Code.Dans le ruban Accueil, sélectionnez le bouton Exécuter tout. Une fois la requête terminée, vous vous apercevez que vous pouvez facilement utiliser PySpark pour interroger les tables Warehouse !
Étape suivante
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour