Tutorial: Uso de un cuaderno con Apache Spark para consultar una base de datos de KQL

Artículo
30/01/2025

Los cuadernos son documentos legibles que contienen descripciones de análisis de datos y resultados, así como documentos que se pueden ejecutar para realizar análisis de datos. En este artículo, aprenderá a usar un cuaderno de Microsoft Fabric para leer y escribir datos en una base de datos KQL mediante Apache Spark. En este tutorial se usan conjuntos de datos y cuadernos creados previamente tanto en inteligencia en tiempo real como en los entornos de Ingeniería de datos en Microsoft Fabric. Para más información sobre los cuadernos, consulte Uso de cuadernos de Microsoft Fabric.

En concreto, aprenderá a:

Crear una base de datos KQL
Importación de un cuaderno
Escritura de datos en una base de datos KQL mediante Apache Spark
Consulta de datos de una base de datos KQL

Requisitos previos

Un área de trabajo con una capacidad habilitada para Microsoft Fabric

1- Creación de una base de datos KQL

Seleccione el área de trabajo en la barra de navegación izquierda.
Siga uno de estos pasos para empezar a crear una secuencia de eventos:
- Seleccione Nuevo elemento y, a continuación, Eventhouse. En el campo Nombre de Eventhouse, escriba nycGreenTaxi y seleccione Crear. Se genera una base de datos KQL con el mismo nombre.
- En un centro de eventos existente, seleccione Bases de datos. En bases de datos KQL, seleccione +, y en el campo nombre de la base de datos KQL, escriba nycGreenTaxi. Luego, seleccione Crear.
Copie el URI de consulta de la tarjeta de detalles de la base de datos en el panel de la base de datos y péguelo en algún lugar, como un bloc de notas, para usarlo en un paso posterior.

2- Descarga del cuaderno NYC GreenTaxi

Hemos creado un cuaderno de ejemplo que le lleva a través de todos los pasos necesarios para cargar datos en la base de datos mediante el conector de Spark.

Abra el repositorio de ejemplos de Fabric en GitHub para descargar el cuaderno de KQL de NYC GreenTaxi.
Guarde el cuaderno localmente en el dispositivo.

Nota

El cuaderno debe guardarse en el formato de archivo .ipynb.

3- Importación del cuaderno

El resto de este flujo de trabajo se produce en la sección Ingeniería de datos del producto y usa un cuaderno de Spark para cargar y consultar datos en la base de datos KQL.

En el área de trabajo, seleccione Importar>Cuaderno>Desde este equipo>Cargar y, después, elija el cuaderno NYC GreenTaxi que descargó en un paso anterior.
Una vez completada la importación, abra este cuaderno desde el área de trabajo.

4- Obtención de datos

Para consultar la base de datos mediante el conector de Spark, debe conceder acceso de lectura y escritura al contenedor de blobs de NYC GreenTaxi.

Seleccione el botón reproducir para ejecutar las celdas siguientes o seleccione la celda y presione Mayús+ Entrar. Repita este paso para cada celda de código.

Nota

Espere a que aparezca la marca de verificación de finalización antes de ejecutar la celda siguiente.

Ejecute la celda siguiente para habilitar el acceso al contenedor de blobs de NYC GreenTaxi.
En KustoURI, pegue el URI de consulta que copió anteriormente en lugar del texto del marcador de posición.
Cambie el nombre de la base de datos de marcador de posición a nycGreenTaxi.
Cambie el nombre de la tabla de marcador de posición a GreenTaxiData.
Ejecute la celda.
Ejecute la celda siguiente para escribir datos en la base de datos. Este paso puede tardar unos minutos en completarse.

La base de datos ahora tiene datos cargados en una tabla denominada GreenTaxiData.

5- Ejecución del cuaderno

Ejecute las dos celdas restantes secuencialmente para consultar datos de la tabla. Los resultados muestran las 20 tarifas y distancias de taxi más altas y más bajas registradas por año.

6. Limpieza de recursos

Limpie los elementos creados; para ello, vaya al área de trabajo en la que se crearon.

En su área de trabajo, pase el ratón por encima del cuaderno que quiere eliminar, seleccione el menú Más>Eliminar.
Seleccione Eliminar. No puede recuperar el cuaderno una vez que lo elimine.

Recursos adicionales

Documentación

Fabric-notebooks gebruiken met gegevens uit een KQL-database - Microsoft Fabric

Meer informatie over het opvragen van gegevens in een KQL-database vanuit Microsoft Fabric Notebooks met behulp van KQL (Kusto Query Language)
KQL-database configureren in een kopieeractiviteit - Microsoft Fabric

In dit artikel wordt uitgelegd hoe u gegevens kopieert met behulp van KQL Database.
Een KQL-database maken - Microsoft Fabric

Meer informatie over het maken van een KQL-database in realtime intelligence.
Een snelkoppeling naar een database maken - Microsoft Fabric

Meer informatie over het maken van een snelkoppeling naar gegevens in een andere KQL-database of in Azure Data Explorer in realtime intelligence.
Toegang tot een bestaande KQL-database - Microsoft Fabric

Leer hoe u toegang krijgt tot een bestaande KQL-database en desgewenst de query-URI en de opname-URI kopieert om query's uit te voeren of gegevens op te halen in Real-Time Intelligence.
Opgeslagen functies maken in Realtime Intelligence - Microsoft Fabric

Meer informatie over het gebruik van de opdracht .create-or-alter function om opgeslagen functies te maken in Realtime Intelligence.
Gegevens ophalen uit bestand - Microsoft Fabric

Meer informatie over het ophalen van gegevens uit een lokaal bestand in een KQL-database in Real-Time Intelligence.
Overzicht van Eventhouse - Microsoft Fabric

Meer informatie over eventhouse-gegevensopslag in realtime intelligence.

Cursos

Módulo

Apache Spark gebruiken in Microsoft Fabric - Training

Apache Spark is een kerntechnologie voor grootschalige gegevensanalyse. Microsoft Fabric biedt ondersteuning voor Spark-clusters, zodat u gegevens op schaal kunt analyseren en verwerken.

Certificación

Microsoft Certified: Fabric Data Engineer Associate - Certifications

As a Fabric Data Engineer, you should have subject matter expertise with data loading patterns, data architectures, and orchestration processes.

Eventos

FabCon Vegas

31 mar, 23 - 2 abr, 23

Evento de aprendizaje de Fabric, Power BI y SQL más grande. 31 de marzo – 2 de abril. Use el código FABINSIDER para ahorrar $400.

Regístrate hoy

Compartir a través de

Tutorial: Uso de un cuaderno con Apache Spark para consultar una base de datos de KQL

Requisitos previos

1- Creación de una base de datos KQL

2- Descarga del cuaderno NYC GreenTaxi

3- Importación del cuaderno

4- Obtención de datos

5- Ejecución del cuaderno

6. Limpieza de recursos

Comentarios

Recursos adicionales

Compartir a través de

Tutorial: Uso de un cuaderno con Apache Spark para consultar una base de datos de KQL

Requisitos previos

1- Creación de una base de datos KQL

2- Descarga del cuaderno NYC GreenTaxi

3- Importación del cuaderno

4- Obtención de datos

5- Ejecución del cuaderno

6. Limpieza de recursos

Contenido relacionado

Comentarios

Recursos adicionales