Tutoriel : Analyser des données avec un notebook

S’applique à : Point de terminaison et entrepôt SQL dans Microsoft Fabric

Dans ce tutoriel, découvrez comment enregistrer vos données une seule fois, puis les utiliser avec de nombreux autres services. Vous pouvez également créer des raccourcis vers les données stockées dans Azure Data Lake Storage et S3 pour vous permettre d’accéder directement aux tables delta à partir de systèmes externes.

Important

Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.

Créer un lakehouse.

Tout d’abord, nous créons un nouveau lakehouse. Pour créer un lakehouse dans votre espace de travail Microsoft Fabric :

  1. Sélectionnez l’espace Data Warehouse Tutorial de travail dans le menu de navigation.

  2. Sélectionnez + Nouveau>Lakehouse (préversion) .

    Capture d’écran du portail Fabric montrant le menu + Nouveau. Lakehouse (préversion) est encadré en rouge.

  3. Dans le champ Nom , entrez ShortcutExercise et sélectionnez Créer.

    Capture d’écran du portail Fabric montrant le champ de nom du nouveau lakehouse. Le nom fourni est ShortcutExercise.

  4. Le nouveau lakehouse se charge et la vue Explorer s’ouvre, avec le menu Obtenir des données dans votre lakehouse. Sous Charger des données dans votre lakehouse, sélectionnez le bouton Nouveau raccourci .

    Capture d’écran du portail Fabric montrant le menu Charger des données dans votre lakehouse sur la page d’accueil. Le bouton de raccourci Nouveau est encadré en rouge.

  5. Dans la fenêtre nouveau raccourci , sélectionnez le bouton de Microsoft OneLake.

    Capture d’écran du portail Fabric montrant la fenêtre Nouveau raccourci. Le bouton de Microsoft OneLake est en rouge.

  6. Dans la fenêtre Sélectionner un type de source de données, faites défiler la liste jusqu’à trouver l’entrepôt que WideWorldImporters vous avez créé précédemment. Sélectionnez-le, puis sélectionnez Suivant.

  7. Dans l’explorateur d’objets OneLake, développez Tables, développez le dbo schéma, puis sélectionnez la case d’option en regard de dimension_customer. Cliquez sur le bouton Créer.

    Capture d’écran du portail Fabric montrant l’explorateur d’objets OneLake. Sous WideWorldImporters, Tables, dbo, la dimension_customer est encadrée en rouge.

  8. Si vous voyez un dossier appelé Unidentified sous Tables, sélectionnez l’icône Actualiser dans la barre de menus horizontale.

    Capture d’écran du portail Fabric montrant le bouton Actualiser dans la barre de menus horizontale et les tables non identifiées sous RaccourciExercise dans l’explorateur Lakehouse.

  9. Sélectionnez dans dimension_customer la liste Table pour afficher un aperçu des données. Notez que le lakehouse affiche les données de la dimension_customer table de l’entrepôt !

    Capture d’écran du portail Fabric montrant l’aperçu des données de la table dimension_customer.

  10. Ensuite, créez un bloc-notes pour interroger la dimension_customer table. Dans le ruban Accueil , sélectionnez la liste déroulante Ouvrir le bloc-notes , puis choisissez Nouveau bloc-notes.

    Capture d’écran du portail Fabric montrant le bouton Ouvrir le bloc-notes enfoncé et l’option Nouveau bloc-notes sélectionnée.

  11. Sélectionnez, puis faites glisser le dimension_customer à partir de la liste Tables dans la cellule ouverte du bloc-notes. Vous pouvez voir qu’une requête PySpark a été écrite pour vous permettre d’interroger toutes les données à partir de ShortcutExercise.dimension_customer. Cette expérience de notebook est similaire à l’expérience de bloc-notes Jupyter de Visual Studio Code. Vous pouvez également ouvrir le notebook dans VS Code.

    Capture d’écran de l’affichage du bloc-notes du portail Fabric. Une flèche indique le chemin d’accès à sélectionner dimension_customer, puis faites-le glisser dans la cellule ouverte du bloc-notes.

  12. Dans le ruban Accueil , sélectionnez le bouton Exécuter tout . Une fois la requête terminée, vous verrez que vous pouvez facilement utiliser PySpark pour interroger les tables d’entrepôt !

    Capture d’écran du portail Fabric montrant les résultats de l’exécution du notebook pour afficher les données de dimension_customer.

Étapes suivantes