Tutorial: Analizar datos con un cuaderno
Se aplica a: punto de conexión de análisis de SQL y Warehouse en Microsoft Fabric
En este tutorial, obtenga información sobre cómo puede guardar los datos una vez y, a continuación, usarlos con muchos otros servicios. También se pueden crear accesos directos a los datos almacenados en Azure Data Lake Storage y S3 para poder acceder directamente a tablas delta desde sistemas externos.
Creación de un almacén de lago
En primer lugar, creamos un nuevo lago de datos. Para crear un nuevo lago de datos en el área de trabajo de Microsoft Fabric:
Seleccione el área de trabajo
Data Warehouse Tutorial
en el menú de navegación.Seleccione + Nuevo> **Lakehouse **.
En el campo Nombre, introduzca
ShortcutExercise
y seleccione Crear.El nuevo lago de datos se carga y se abre la vista Explorador, con el menú Obtener datos en el lago de datos. En Cargar datos en el lago de datos, seleccione el botón Nuevo acceso directo.
En la ventana Nuevo acceso directo, seleccione el botón Microsoft OneLake.
En la ventana Seleccionar un tipo de origen de datos, desplácese por la lista hasta que encuentre el almacenamiento denominado
WideWorldImporters
que creó anteriormente. Selecciónelo y, a continuación, elija Siguiente.En el explorador de objetos OneLake, expanda Tablas, expanda el esquema
dbo
y, a continuación, seleccione el botón de radio situado junto adimension_customer
. Seleccione el botón Crear.Si ve una carpeta denominada
Unidentified
en Tablas, seleccione el icono Actualizar en la barra de menús horizontal.Seleccione en
dimension_customer
la lista Tabla para obtener una vista previa de los datos. Observe que el lago de datos muestra los datos de la tabladimension_customer
del almacenamiento.A continuación, cree un cuaderno para consultar la tabla
dimension_customer
. En la cinta de opciones Inicio, seleccione la lista desplegable Abrir cuaderno y elija Nuevo cuaderno.Seleccione y arrastre
dimension_customer
desde la lista Tablas a la celda del cuaderno abierto. Puede ver que se ha escrito una consulta de PySpark para consultar todos los datos deShortcutExercise.dimension_customer
. Esta experiencia de cuaderno es similar a la experiencia de cuaderno de Jupyter de Visual Studio Code. También puede abrir el cuaderno en VS Code.En la cinta de opciones Inicio, seleccione el botón Ejecutar todo. Una vez completada la consulta, verá que puede usar fácilmente PySpark para consultar las tablas de almacenamiento.
Paso siguiente
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de