Tutoriel : Utiliser un notebook avec Apache Spark pour interroger une base de données KQL
Important
Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.
Les notebooks sont à la fois des documents lisibles contenant des descriptions et des résultats d’analyse des données, ainsi que des documents exécutables qui peuvent être exécutés pour effectuer une analyse des données. Dans cet article, vous allez apprendre à utiliser un notebook Microsoft Fabric pour lire et écrire des données dans une base de données KQL à l’aide d’Apache Spark. Ce tutoriel utilise des jeux de données et des notebooks précréés dans les environnements d’analytique en temps réel et de Ingénieurs de données dans Microsoft Fabric. Pour plus d’informations sur les notebooks, consultez Utilisation des notebooks Microsoft Fabric.
Plus précisément, vous apprenez à :
- Créer une base de données KQL
- Importer un notebook
- Écrire des données dans une base de données KQL à l’aide d’Apache Spark
- Interroger des données à partir d’une base de données KQL
Prérequis
- Un espace de travail avec une capacité compatible avec Microsoft Fabric
1- Créer une base de données KQL
Ouvrez le sélecteur d’expérience en bas du volet de navigation, puis sélectionnez Analyse en temps réel.
Sélectionnez la vignette Base de données KQL (préversion).
Dans le champ Nom de la base de données KQL , entrez nycGreenTaxi, puis sélectionnez Créer.
La base de données KQL a maintenant été créée dans le contexte de l’espace de travail sélectionné.
Copiez l’URI de requête à partir des détails de la base de données carte dans le tableau de bord de la base de données et collez-le quelque part, comme un bloc-notes, pour l’utiliser à une étape ultérieure.
2- Télécharger le notebook New York GreenTaxi
Nous avons créé un exemple de notebook qui vous guide dans toutes les étapes nécessaires pour charger des données dans votre base de données à l’aide du connecteur Spark.
Ouvrez le référentiel d’exemples Fabric sur GitHub pour télécharger le notebook KQL GreenTaxi de New York.
Enregistrez le notebook localement sur votre appareil.
Notes
Le notebook doit être enregistré au format de
.ipynb
fichier.
3- Importer le notebook
Le reste de ce workflow se produit dans la section Ingénieurs de données du produit et utilise un notebook Spark pour charger et interroger des données dans votre base de données KQL.
Ouvrez le sélecteur d’expérience en bas du volet de navigation et sélectionnez Ingénieurs de données.
Sélectionnez Importer un bloc-notes.
Dans la fenêtre Importer status, sélectionnez Charger.
Sélectionnez le notebook New York GreenTaxi que vous avez téléchargé à l’étape précédente.
Une fois l’importation terminée, revenez à votre espace de travail pour ouvrir ce notebook.
4- Obtenir des données
Pour interroger votre base de données à l’aide du connecteur Spark, vous devez accorder un accès en lecture et en écriture au conteneur d’objets blob New York GreenTaxi.
Sélectionnez le bouton de lecture pour exécuter les cellules suivantes, ou sélectionnez la cellule et appuyez sur Maj+Entrée. Répétez cette étape pour chaque cellule de code.
Notes
Attendez que la marque d’achèvement case activée s’affiche avant d’exécuter la cellule suivante.
Exécutez la cellule suivante pour activer l’accès au conteneur d’objets blob New York GreenTaxi.
Dans KustoURI, collez l’URI de requête que vous avez copié précédemment au lieu du texte de l’espace réservé.
Remplacez le nom de la base de données d’espace réservé par nycGreenTaxi.
Remplacez le nom de la table d’espace réservé par GreenTaxiData.
Exécutez la cellule.
Exécutez la cellule suivante pour écrire des données dans votre base de données. L’exécution de cette étape peut prendre quelques minutes.
Votre base de données a maintenant des données chargées dans une table nommée GreenTaxiData.
5- Exécuter le notebook
Exécutez les deux cellules restantes séquentiellement pour interroger les données de votre table. Les résultats montrent les 20 premiers tarifs et distances de taxi les plus élevés et les plus bas enregistrés par année.
6- Nettoyer les ressources
Nettoyez les éléments créés en accédant à l’espace de travail dans lequel ils ont été créés.
Dans votre espace de travail, pointez sur le bloc-notes que vous souhaitez supprimer, sélectionnez le menu Plus [...] >Supprimer.
Sélectionnez Supprimer. Vous ne pouvez pas récupérer votre bloc-notes une fois que vous l’avez supprimé.