Tutorial de lagos de datos: Creación de una instancia de lago de datos, ingesta de datos de ejemplo y compilación de un informe

En este tutorial, creará una instancia de lago de datos, ingerirá datos de ejemplo en la tabla delta, aplicará la transformación cuando sea necesario y, a continuación, creará informes.

Requisitos previos

Creación de un almacén de lago

  1. En el servicio Power BI, seleccione Áreas de trabajo en el menú de la izquierda.

  2. Para abrir el área de trabajo, escriba su nombre en el cuadro de texto de búsqueda ubicado en la parte superior y selecciónelo en los resultados de la búsqueda.

  3. En el conmutador de experiencia situado en la parte inferior izquierda, seleccione Ingeniería de datos.

    Captura de pantalla que muestra dónde seleccionar el conmutador de experiencias y la Ingeniería de datos.

  4. En la pestaña Ingeniería de datos, seleccione Lago de datos para crear un lago.

  5. En el cuadro de diálogo Nuevo lago, escriba wwilakehouse en el campo Nombre.

    Captura de pantalla del cuadro de diálogo Nuevo lago.

  6. Seleccione Crear para crear y abrir el nuevo lago.

Ingesta de datos de ejemplo

Nota:

Si no tiene OneDrive configurado, regístrese para obtener la evaluación gratuita de Microsoft 365: Evaluación gratuita: Pruebe Microsoft 365 durante un mes.

  1. Descargue el archivo dimension_customer.csv del repositorio de ejemplos de Fabric.

  2. En el explorador de Lago de datos, verá opciones para cargar datos en el lago. Seleccione Nuevo Flujo de datos Gen2.

    Captura de pantalla que muestra dónde seleccionar la opción Nuevo Flujo de datos Gen2 para cargar datos en su lago.

  3. En el nuevo panel de flujo de datos, seleccione Importar desde un archivo Text/CSV.

  4. En el panel Conectar al origen de datos, seleccione el botón de radio Cargar archivo. Arrastre y coloque el archivo dimension_customer.csv que descargó en el paso 1. Una vez cargado el archivo, seleccione Siguiente.

    Captura de pantalla que muestra dónde seleccionar Cargar archivo y dónde arrastrar el archivo descargado previamente.

  5. En la página Vista previa de los datos del archivo, obtenga una vista previa de los datos y seleccione Crear para continuar y volver al lienzo del flujo de datos.

  6. En el panel Configuración de consulta , actualice el campo Nombre a dimension_customer.

    Nota:

    Fabric agrega un espacio y un número al final del nombre de la tabla de forma predeterminada. Los nombres de tabla deben estar en minúsculas y no deben contener espacios. Cambie el nombre de forma adecuada y quite los espacios del nombre de la tabla.

    Captura de pantalla del panel de configuración de la consulta, que muestra dónde escribir el nombre y seleccionar el destino de los datos.

  7. En este tutorial, ya ha asociado los datos del cliente a una instancia de Lakehouse. En caso de que tenga otros elementos de datos que desee asociar al almacén de lago, puede agregarlos con los pasos siguientes:

    • En los elementos de menú, seleccione Agregar destino de datos y seleccione Lago de datos. En la pantalla Conectar al destino de datos, inicie sesión en su cuenta si es necesario y seleccione Siguiente.

    • Vaya a wwilakehouse en el área de trabajo.

    • Si la tabla dimension_customer no existe, seleccione la opción Nueva tabla y escriba el nombre de la tabla dimension_customer. Si la tabla ya existe, seleccione la opción Tabla existente y elija dimension_customer en la lista de tablas del explorador de objetos. Seleccione Siguiente.

      Captura de pantalla que muestra cómo elegir la tabla de destino.

    • En el panel Elegir configuración de destino, seleccione Reemplazar como método de Actualización. Seleccione Guardar configuración para volver al lienzo del flujo de datos.

  8. Desde el lienzo del flujo de datos, puede transformar fácilmente los datos en función de sus requisitos empresariales. Por motivos de simplicidad, no estamos realizando ningún cambio en este tutorial. Para continuar, seleccione Publicar en la parte inferior derecha de la pantalla.

    Captura de pantalla del panel de configuración de consultas que contiene el botón Publicar.

  9. Un círculo giratorio junto al nombre del flujo de datos indica que la publicación está en curso en la vista de elementos. Una vez completada la publicación, seleccione ... y seleccione Propiedades. Cambie el nombre del flujo de datos a Cargar tabla de lago de datos y seleccione Guardar.

  10. Seleccione la opción Actualizar ahora junto al nombre del flujo de datos para actualizar el flujo de datos. Ejecuta el flujo de datos y mueve los datos del archivo de origen a la tabla de lago de datos. Mientras está en curso, verá un círculo giratorio en la columna Actualizado en la vista de elementos.

    Captura de pantalla que muestra dónde encontrar el icono Actualizar ahora.

  11. Una vez actualizado el flujo de datos, seleccione la nueva instancia de lago de datos en el panel de navegación izquierdo para ver la tabla delta de dimension_customer.

    Captura de pantalla del panel de navegación desde el que se abre el almacén de lago.

  12. Seleccione la tabla para obtener una vista previa de sus datos. También puede usar el punto de conexión de SQL Analytics del almacén de lago para consultar los datos con instrucciones SQL. Seleccione Punto de conexión de SQL Analytics en el menú desplegable de Almacén de lago en la parte superior derecha de la pantalla.

    Captura de pantalla de la tabla delta, que muestra dónde seleccionar el punto de conexión de análisis SQL.

  13. Seleccione la tabla dimension_customer para obtener una vista previa de sus datos o seleccione Nueva consulta SQL para escribir las instrucciones SQL.

    Captura de pantalla del punto de conexión de análisis SQL, que muestra dónde seleccionar la Nueva consulta SQL.

  14. La siguiente consulta de ejemplo agrega el recuento de filas en función de la columna BuyingGroup de la tabla dimension_customer. Los archivos de consulta SQL se guardan automáticamente para futuras referencias y puede cambiar el nombre o eliminar estos archivos en función de sus necesidades.

    Para ejecutar el script, seleccione el icono Ejecutar en la parte superior del archivo de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Generación de un informe

  1. Previamente, todas las tablas y vistas del almacén de lago se añadieron automáticamente al modelo semántico. Con las actualizaciones recientes, para los nuevos almacenes de lago, debe añadir manualmente las tablas al modelo semántico. En la pestaña Informes del almacén de lago, seleccione Administrar modelo semántico predeterminado y seleccione las tablas que desea añadir al modelo semántico. En este caso, seleccione la tabla dimension_customer.

    Captura de pantalla en la que puede seleccionar las tablas que se van a añadir al modelo semántico.

  2. Para asegurarse de que las tablas del modelo semántico estén siempre sincronizadas, cambie a la vista punto de conexión de análisis SQL y abra el panel de configuración del almacén de lago. Seleccione la configuración predeterminada del modelo semántico de Power BI y active Sincronizar el modelo semántico de Power BI predeterminado. Consulte Modelos semánticos predeterminados de Power BI para obtener más información.

    Captura de pantalla que muestra cómo activar la sincronización de datos con el modelo semántico predeterminado

  3. Una vez añadida la tabla, se crea un modelo semántico con el mismo nombre que el almacén de lago.

    Captura de pantalla que muestra el modelo semántico predeterminado que se creó cuando se creó el nuevo lago.

  4. En el panel del modelo semántico, puede ver todas las tablas. Tiene opciones para crear informes desde cero, un informe paginado o permitir que Power BI cree automáticamente un informe en función de los datos. Para este tutorial, seleccione Creación automática de un informe en Explorar estos datos. En el siguiente tutorial, se crea un informe desde cero.

    Captura de pantalla de la página de detalles del modelo semántico, que muestra dónde seleccionar Crear un informe.

  5. Dado que la tabla es una dimensión y no hay ninguna medida en ella, Power BI crea una medida para el recuento de filas y la agrega en distintas columnas y crea gráficos diferentes, como se muestra en la imagen siguiente. Para guardar este informe en el futuro, seleccione Guardar en la cinta de opciones superior. Puede realizar más cambios en este informe para satisfacer sus necesidades si incluye o excluye otras tablas o columnas.

    Captura de pantalla de una página de resumen rápido que muestra cuatro gráficos de barras diferentes.

Paso siguiente