Tutoriel : Analyser des données avec un notebook
S’applique à : Point de terminaison et entrepôt SQL dans Microsoft Fabric
Dans ce tutoriel, découvrez comment enregistrer vos données une seule fois, puis les utiliser avec de nombreux autres services. Vous pouvez également créer des raccourcis vers les données stockées dans Azure Data Lake Storage et S3 pour vous permettre d’accéder directement aux tables delta à partir de systèmes externes.
Important
Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.
Créer un lakehouse.
Tout d’abord, nous créons un nouveau lakehouse. Pour créer un lakehouse dans votre espace de travail Microsoft Fabric :
Sélectionnez l’espace
Data Warehouse Tutorial
de travail dans le menu de navigation.Sélectionnez + Nouveau>Lakehouse (préversion) .
Dans le champ Nom , entrez
ShortcutExercise
et sélectionnez Créer.Le nouveau lakehouse se charge et la vue Explorer s’ouvre, avec le menu Obtenir des données dans votre lakehouse. Sous Charger des données dans votre lakehouse, sélectionnez le bouton Nouveau raccourci .
Dans la fenêtre nouveau raccourci , sélectionnez le bouton de Microsoft OneLake.
Dans la fenêtre Sélectionner un type de source de données, faites défiler la liste jusqu’à trouver l’entrepôt que
WideWorldImporters
vous avez créé précédemment. Sélectionnez-le, puis sélectionnez Suivant.Dans l’explorateur d’objets OneLake, développez Tables, développez le
dbo
schéma, puis sélectionnez la case d’option en regard dedimension_customer
. Cliquez sur le bouton Créer.Si vous voyez un dossier appelé
Unidentified
sous Tables, sélectionnez l’icône Actualiser dans la barre de menus horizontale.Sélectionnez dans
dimension_customer
la liste Table pour afficher un aperçu des données. Notez que le lakehouse affiche les données de ladimension_customer
table de l’entrepôt !Ensuite, créez un bloc-notes pour interroger la
dimension_customer
table. Dans le ruban Accueil , sélectionnez la liste déroulante Ouvrir le bloc-notes , puis choisissez Nouveau bloc-notes.Sélectionnez, puis faites glisser le
dimension_customer
à partir de la liste Tables dans la cellule ouverte du bloc-notes. Vous pouvez voir qu’une requête PySpark a été écrite pour vous permettre d’interroger toutes les données à partir deShortcutExercise.dimension_customer
. Cette expérience de notebook est similaire à l’expérience de bloc-notes Jupyter de Visual Studio Code. Vous pouvez également ouvrir le notebook dans VS Code.Dans le ruban Accueil , sélectionnez le bouton Exécuter tout . Une fois la requête terminée, vous verrez que vous pouvez facilement utiliser PySpark pour interroger les tables d’entrepôt !