Tutorial: Análisis de datos con un cuaderno

Se aplica a: Punto de conexión y almacenamiento de SQL en Microsoft Fabric

En este tutorial, obtenga información sobre cómo puede guardar los datos una vez y, a continuación, usarlos con muchos otros servicios. También se pueden crear accesos directos a los datos almacenados en Azure Data Lake Storage y S3 para permitirle acceder directamente a tablas delta desde sistemas externos.

Importante

Microsoft Fabric está en versión preliminar.

Creación de un almacén de lago

En primer lugar, creamos un nuevo lago. Para crear un nuevo lago en el área de trabajo de Microsoft Fabric:

  1. Seleccione el Data Warehouse Tutorial área de trabajo en el menú de navegación.

  2. Seleccione + New>Lakehouse (versión preliminar).

    Captura de pantalla del portal de Fabric que muestra el menú + Nuevo. Lakehouse (versión preliminar) está en rojo.

  3. En el campo Nombre , escriba ShortcutExercise y seleccione Crear.

    Captura de pantalla del portal de Fabric en la que se muestra el campo de nombre de la nueva instancia de Lakehouse. El nombre proporcionado es ShortcutExercise.

  4. La nueva instancia de Lakehouse se carga y se abre la vista Explorador , con el menú Obtener datos en el menú de lakehouse . En Cargar datos en lakehouse, seleccione el botón Nuevo acceso directo .

    Captura de pantalla del portal de Fabric que muestra el menú Cargar datos en el menú de Lakehouse en la página de aterrizaje. El botón Nuevo acceso directo está en rojo.

  5. En la ventana Nuevo acceso directo , seleccione el botón de Microsoft OneLake.

    Captura de pantalla del portal de Fabric que muestra la ventana Nuevo acceso directo. El botón de Microsoft OneLake está en rojo.

  6. En la ventana Seleccionar un tipo de origen de datos, desplácese por la lista hasta que encuentre el almacén denominado WideWorldImporters que creó anteriormente. Selecciónelo y, a continuación, seleccione Siguiente.

  7. En el explorador de objetos OneLake, expanda Tablas, expanda el dbo esquema y, a continuación, seleccione el botón de radio situado junto a dimension_customer. Seleccione el botón Crear.

    Captura de pantalla del portal de Fabric en la que se muestra el explorador de objetos OneLake. En WideWorldImporters, Tables, dbo, el dimension_customer está en rojo.

  8. Si ve una carpeta denominada Unidentified en Tablas, seleccione el icono Actualizar en la barra de menús horizontal.

    Captura de pantalla del portal de Fabric que muestra el botón Actualizar en la barra de menús horizontal y las tablas no identificadas en ShortcutExercise en el explorador de Lakehouse.

  9. Seleccione en dimension_customer la lista Tabla para obtener una vista previa de los datos. Observe que lakehouse muestra los datos de la dimension_customer tabla desde el almacén.

    Captura de pantalla del portal de Fabric que muestra la vista previa de datos de la tabla dimension_customer.

  10. A continuación, cree un cuaderno para consultar la dimension_customer tabla. En la cinta Inicio , seleccione la lista desplegable Abrir cuaderno y elija Nuevo cuaderno.

    Captura de pantalla del portal de Fabric que muestra el botón Abrir cuaderno presionado y la opción Nuevo cuaderno seleccionada.

  11. Seleccione y arrastre el dimension_customer elemento de la lista Tablas a la celda del cuaderno abierto. Puede ver que se ha escrito una consulta de PySpark para consultar todos los datos de ShortcutExercise.dimension_customer. Esta experiencia de cuaderno es similar a Visual Studio Code experiencia de jupyter notebook. También puede abrir el cuaderno en VS Code.

    Captura de pantalla de la vista del cuaderno del portal de Fabric. Una flecha indica la ruta de acceso para seleccionar dimension_customer y, a continuación, arrastrarla y colocarla en la celda del cuaderno abierto.

  12. En la cinta Inicio , seleccione el botón Ejecutar todo . Una vez completada la consulta, verá que puede usar fácilmente PySpark para consultar las tablas de almacenamiento.

    Captura de pantalla del portal de Fabric que muestra los resultados de ejecutar el cuaderno para mostrar datos de dimension_customer.

Pasos siguientes