Compartir vía


Tutorial de lagos de datos: Creación de una instancia de lago de datos, ingesta de datos de ejemplo y compilación de un informe

En este tutorial, creará una instancia de lago de datos, ingerirá datos de ejemplo en la tabla delta, aplicará la transformación cuando sea necesario y, a continuación, creará informes.

Requisitos previos

Creación de un almacén de lago

  1. En Power BI, seleccione Áreas de trabajo en el menú de la izquierda.

  2. Para abrir el área de trabajo, escriba su nombre en el cuadro de texto de búsqueda ubicado en la parte superior y selecciónelo en los resultados de la búsqueda.

  3. En el conmutador situado en la parte inferior izquierda, seleccione Ingeniería de datos.

    Captura de pantalla que muestra dónde seleccionar el conmutador e Ingeniería de datos.

  4. En la pantalla Ingeniería de datos, seleccione Lakehouse para crear un lakehouse.

  5. En el cuadro de diálogo Nuevo lago, escriba wwilakehouse en el campo Nombre.

    Captura de pantalla del cuadro de diálogo Nuevo lago.

  6. Seleccione Crear para crear y abrir el nuevo lago.

Ingesta de datos de ejemplo

Nota:

Si no tiene OneDrive configurado, regístrese para obtener la evaluación gratuita de Microsoft 365: Evaluación gratuita: Pruebe Microsoft 365 durante un mes.

  1. Descargue el archivo dimension_customer.csv del repositorio de ejemplos de Fabric.

  2. En la pestaña Inicio, en Obtener datos en el lakehouse, verá opciones para cargar datos en el lakehouse. Seleccione Nuevo Flujo de datos Gen2.

    Captura de pantalla que muestra dónde seleccionar la opción Nuevo Flujo de datos Gen2 para cargar datos en su lago.

  3. En la nueva pantalla de flujo de datos, seleccione Importar desde un archivo de texto/CSV.

  4. En la pantalla Conectar al origen de datos, seleccione el botón de selección Cargar archivo. Arrastre y coloque el archivo dimension_customer.csv que descargó en el paso 1. Una vez cargado el archivo, seleccione Siguiente.

    Captura de pantalla que muestra dónde seleccionar Cargar archivo y dónde arrastrar el archivo descargado previamente.

  5. En la página Vista previa de los datos del archivo, obtenga una vista previa de los datos y seleccione Crear para continuar y volver al lienzo del flujo de datos.

  6. En el panel Configuración de consulta , actualice el campo Nombre a dimension_customer.

    Nota:

    Fabric agrega un espacio y un número al final del nombre de la tabla de forma predeterminada. Los nombres de tabla deben estar en minúsculas y no deben contener espacios. Cambie el nombre de forma adecuada y quite los espacios del nombre de la tabla.

    Captura de pantalla del panel de configuración de la consulta, que muestra dónde escribir el nombre y seleccionar el destino de los datos.

  7. En este tutorial, ya asoció los datos del cliente a una instancia de Lakehouse. Si tiene otros elementos de datos que desee asociar al lakehouse, puede agregarlos mediante los siguientes pasos:

    1. En los elementos de menú, seleccione Agregar destino de datos y seleccione Lago de datos. En la pantalla Conectar al destino de datos, inicie sesión en su cuenta si es necesario y seleccione Siguiente.

    2. Vaya a wwilakehouse en el área de trabajo.

    3. Si la tabla dimension_customer no existe, seleccione la opción Nueva tabla y escriba el nombre de la tabla dimension_customer. Si la tabla ya existe, seleccione la opción Tabla existente y elija dimension_customer en la lista de tablas del explorador de objetos. Seleccione Siguiente.

      Captura de pantalla que muestra cómo elegir la tabla de destino.

    4. En el panel Elegir configuración de destino, seleccione Reemplazar como método de Actualización. Seleccione Guardar configuración para volver al lienzo del flujo de datos.

  8. Desde el lienzo del flujo de datos, puede transformar fácilmente los datos en función de sus requisitos empresariales. Por motivos de simplicidad, no estamos realizando ningún cambio en este tutorial. Para continuar, seleccione Publicar en la parte inferior derecha de la pantalla.

    Captura de pantalla del panel de configuración de consultas que contiene el botón Publicar.

  9. Un círculo giratorio junto al nombre del flujo de datos indica que la publicación está en curso en la vista de elementos. Una vez completada la publicación, seleccione ... y seleccione Propiedades. Cambie el nombre del flujo de datos a Cargar tabla de lago de datos y seleccione Guardar.

  10. Seleccione la opción Actualizar ahora junto al nombre del flujo de datos para actualizar el flujo de datos. Esta opción ejecuta el flujo de datos y mueve los datos del archivo de origen a la tabla de lago de datos. Mientras está en curso, verá un círculo giratorio en la columna Actualizado en la vista de elementos.

    Captura de pantalla que muestra dónde encontrar el icono Actualizar ahora.

  11. Una vez actualizado el flujo de datos, seleccione una nueva instancia de Lakehouse en la barra de navegación izquierda para ver la tabla delta de dimension_customer.

    Captura de pantalla del panel de navegación desde el que se abre el almacén de lago.

  12. Seleccione la tabla para obtener una vista previa de sus datos. También puede usar el punto de conexión de SQL Analytics del almacén de lago para consultar los datos con instrucciones SQL. Seleccione Punto de conexión de SQL Analytics en el menú desplegable de Almacén de lago en la parte superior derecha de la pantalla.

    Captura de pantalla de la tabla delta, que muestra dónde seleccionar el punto de conexión de análisis SQL.

  13. Seleccione la tabla dimension_customer para obtener una vista previa de sus datos o seleccione Nueva consulta SQL para escribir las instrucciones SQL.

    Captura de pantalla del punto de conexión de análisis SQL, que muestra dónde seleccionar la Nueva consulta SQL.

  14. La siguiente consulta de ejemplo agrega el recuento de filas en función de la columna BuyingGroup de la tabla dimension_customer. Los archivos de consulta SQL se guardan automáticamente para futuras referencias y puede cambiar el nombre o eliminar estos archivos en función de sus necesidades.

    Para ejecutar el script, seleccione el icono Ejecutar en la parte superior del archivo de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Generación de un informe

  1. Previamente, todas las tablas y vistas del almacén de lago se añadieron automáticamente al modelo semántico. Con las actualizaciones recientes, para las nuevas instancias de Lakehouse, debe añadir manualmente las tablas al modelo semántico. Abra lakehouse y cambie a la vista punto de conexión de análisis SQL. En la pestaña Informes, seleccione Administrar modelo semántico predeterminado y seleccione las tablas que desea añadir al modelo semántico. En este caso, seleccione la tabla dimension_customer.

    Captura de pantalla en la que puede seleccionar las tablas que se van a añadir al modelo semántico.

  2. Para asegurarse de que las tablas del modelo semántico estén siempre sincronizadas, cambie a la vista punto de conexión de análisis SQL y abra el panel de configuración del almacén de lago. Seleccione modelo semántico predeterminado de Power BI y active Sincronizar el modelo semántico de Power BI predeterminado. Consulte Modelos semánticos predeterminados de Power BI para obtener más información.

    Captura de pantalla que muestra cómo activar la sincronización de datos con el modelo semántico predeterminado

  3. Una vez añadida la tabla, Fabric crea un modelo semántico con el mismo nombre que el lakehouse.

    Captura de pantalla que muestra el modelo semántico predeterminado que se creó cuando se creó el nuevo lago.

  4. En el panel del modelo semántico, puede ver todas las tablas. Tiene opciones para crear informes desde cero, informes paginados o permitir que Power BI cree automáticamente un informe en función de los datos. Para este tutorial, seleccione Creación automática de un informe en Explorar estos datos. En el siguiente tutorial, se crea un informe desde cero.

    Captura de pantalla de la página de detalles del modelo semántico, que muestra dónde seleccionar Crear un informe.

  5. Dado que la tabla es una dimensión y no hay ninguna medida en ella, Power BI crea una medida para el recuento de filas y la agrega en distintas columnas y crea gráficos diferentes, como se muestra en la imagen siguiente. Para guardar este informe en el futuro, seleccione Guardar en la cinta de opciones superior. Puede realizar más cambios en este informe para satisfacer sus necesidades si incluye o excluye otras tablas o columnas.

    Captura de pantalla de una página de resumen rápido que muestra cuatro gráficos de barras diferentes.

Paso siguiente