Tutorial: Analizar datos con un cuaderno

Se aplica a: punto de conexión de análisis de SQL y Warehouse en Microsoft Fabric

En este tutorial, obtenga información sobre cómo puede guardar los datos una vez y, a continuación, usarlos con muchos otros servicios. También se pueden crear accesos directos a los datos almacenados en Azure Data Lake Storage y S3 para poder acceder directamente a tablas delta desde sistemas externos.

Creación de un almacén de lago

En primer lugar, creamos un nuevo lago de datos. Para crear un nuevo lago de datos en el área de trabajo de Microsoft Fabric:

  1. Seleccione el área de trabajo Data Warehouse Tutorial en el menú de navegación.

  2. Seleccione + Nuevo> **Lakehouse **.

    A screenshot from the Fabric portal showing the + New menu. Lakehouse is boxed in red.

  3. En el campo Nombre, introduzca ShortcutExercise y seleccione Crear.

    A screenshot from the Fabric portal showing name field for the new lakehouse. The name provided is ShortcutExercise.

  4. El nuevo lago de datos se carga y se abre la vista Explorador, con el menú Obtener datos en el lago de datos. En Cargar datos en el lago de datos, seleccione el botón Nuevo acceso directo.

    A screenshot from the Fabric portal showing the Load data in your lakehouse menu on the landing page. The New shortcut button is boxed in red.

  5. En la ventana Nuevo acceso directo, seleccione el botón Microsoft OneLake.

    A screenshot from the Fabric portal showing the New shortcut window. The button for Microsoft OneLake is boxed in red.

  6. En la ventana Seleccionar un tipo de origen de datos, desplácese por la lista hasta que encuentre el almacenamiento denominado WideWorldImporters que creó anteriormente. Selecciónelo y, a continuación, elija Siguiente.

  7. En el explorador de objetos OneLake, expanda Tablas, expanda el esquema dbo y, a continuación, seleccione el botón de radio situado junto a dimension_customer. Seleccione el botón Crear.

    A screenshot from the Fabric portal showing the OneLake object browser. Under WideWorldImporters, Tables, dbo, the dimension_customer is boxed in red.

  8. Si ve una carpeta denominada Unidentified en Tablas, seleccione el icono Actualizar en la barra de menús horizontal.

    A screenshot from the Fabric portal showing the refresh button on the horizontal menu bar, and the Unidentified tables under ShortcutExercise in the Lakehouse explorer.

  9. Seleccione en dimension_customer la lista Tabla para obtener una vista previa de los datos. Observe que el lago de datos muestra los datos de la tabla dimension_customer del almacenamiento.

    A screenshot from the Fabric portal showing the data preview of the dimension_customer table.

  10. A continuación, cree un cuaderno para consultar la tabla dimension_customer. En la cinta de opciones Inicio, seleccione la lista desplegable Abrir cuaderno y elija Nuevo cuaderno.

    A screenshot from the Fabric portal showing the Open notebook button pressed, and the New notebook option selected.

  11. Seleccione y arrastre dimension_customer desde la lista Tablas a la celda del cuaderno abierto. Puede ver que se ha escrito una consulta de PySpark para consultar todos los datos de ShortcutExercise.dimension_customer. Esta experiencia de cuaderno es similar a la experiencia de cuaderno de Jupyter de Visual Studio Code. También puede abrir el cuaderno en VS Code.

    A screenshot from the Fabric portal notebook view. An arrow indicates the path to select dimension_customer, then drag and drop it into the open notebook cell.

  12. En la cinta de opciones Inicio, seleccione el botón Ejecutar todo. Una vez completada la consulta, verá que puede usar fácilmente PySpark para consultar las tablas de almacenamiento.

    A screenshot from the Fabric portal showing the results of running the notebook to display data from dimension_customer.

Paso siguiente