Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
En este tutorial, creará una instancia de lago de datos, ingerirá datos de ejemplo en la tabla delta, aplicará la transformación cuando sea necesario y, a continuación, creará informes. Esta es una lista de comprobación de los pasos que ha completado:
Si no tiene Microsoft Fabric, regístrese para obtener una capacidad de evaluación gratuita.
Requisitos previos
- Antes de crear un lakehouse, deberá crear un área de trabajo de Fabric.
- Antes de ingerir un archivo CSV, debe tener configurado OneDrive. Si no tiene OneDrive configurado, regístrese para obtener la evaluación gratuita de Microsoft 365: Evaluación gratuita: Pruebe Microsoft 365 durante un mes.
¿Por qué necesito OneDrive para este tutorial?
Necesita OneDrive para este tutorial porque el proceso de ingesta de datos se basa en OneDrive como mecanismo de almacenamiento subyacente para cargas de archivos. Al cargar un archivo CSV en Fabric, se almacena temporalmente en tu cuenta de OneDrive antes de ingerirlo en el lakehouse. Esta integración garantiza la transferencia segura y sin problemas de archivos dentro del ecosistema de Microsoft 365.
El paso de ingesta no funciona si no tiene configurado OneDrive, ya que Fabric no puede acceder al archivo cargado. Si ya tiene los datos disponibles en lakehouse u otra ubicación admitida, OneDrive no es necesario.
Nota:
Si ya tiene datos en lakehouse, puede usar esos datos en lugar del archivo CSV de ejemplo. Para comprobar si los datos ya están asociados a lakehouse, use el Explorador de Lakehouse o el punto de conexión de SQL Analytics para examinar tablas, archivos y carpetas. Para más información sobre cómo comprobarlo, consulte Introducción a Lakehouse y Consulta de tablas de Lakehouse con el punto de conexión de SQL Analytics.
Creación de un almacén de lago
En esta sección, va a crear un almacén de lago de datos en Fabric.
En Fabric, seleccione Áreas de trabajo en la barra de navegación.
Para abrir el área de trabajo, escriba su nombre en el cuadro de búsqueda situado en la parte superior y selecciónelo en los resultados de la búsqueda.
En el área de trabajo, seleccione Nuevo elemento, escriba Lakehouse en el cuadro de búsqueda y, a continuación, seleccione Lakehouse.
En el cuadro de diálogo Nuevo lago, escriba wwilakehouse en el campo Nombre.
Seleccione Crear para crear y abrir el nuevo lago.
Ingesta de datos de ejemplo
En esta sección, ingerirá datos de cliente de muestra en almacén de lago.
Nota:
Si no tiene OneDrive configurado, regístrese para obtener la evaluación gratuita de Microsoft 365: Evaluación gratuita: Pruebe Microsoft 365 durante un mes.
Descargue el archivo dimension_customer.csv del repositorio de ejemplos de Fabric.
En la pestaña Inicio, en Obtener datos en el lakehouse, verá opciones para cargar datos en el lakehouse. Seleccione Nuevo Flujo de datos Gen2.
En el panel Crear un flujo de datos , escriba Datos de dimensión de cliente en el campo Nombre y seleccione Siguiente.
En la nueva pantalla de flujo de datos, seleccione Importar desde un archivo de texto/CSV.
En la pantalla Conectar al origen de datos, seleccione el botón de selección Cargar archivo. Arrastre y coloque el archivo dimension_customer.csv que descargó en el paso 1. Una vez cargado el archivo, seleccione Siguiente.
En la página Vista previa de los datos del archivo, obtenga una vista previa de los datos y seleccione Crear para continuar y volver al lienzo del flujo de datos.
Transformación y carga de datos en lakehouse
En esta sección, transformará los datos en función de los requisitos empresariales y los cargará en lakehouse.
En el panel Configuración de consulta , actualice el campo Nombre a dimension_customer.
Nota:
Fabric agrega un espacio y un número al final del nombre de la tabla de forma predeterminada. Los nombres de tabla deben estar en minúsculas y no deben contener espacios. Renómbrelo apropiadamente y elimine cualquier espacio del nombre de la tabla.
En este tutorial, ya asoció los datos del cliente a una instancia de Lakehouse. Si crea un flujo de datos desde lakehouse, los datos cargados se vinculan automáticamente al lago predeterminado. Si va a crear el flujo de datos por separado, puede asociarlo opcionalmente a una instancia de Lakehouse siguiendo estos pasos:
En los elementos de menú, seleccione Agregar destino de datos y seleccione Lago de datos. En la pantalla Conectar al destino de datos , inicie sesión en su cuenta si es necesario y seleccione Siguiente.
Vaya a wwilakehouse en el área de trabajo.
Si la tabla dimension_customer no existe, seleccione la opción Nueva tabla y escriba el nombre de la tabla dimension_customer. Si la tabla ya existe, seleccione la opción Tabla existente y elija dimension_customer en la lista de tablas del explorador de objetos. Seleccione Siguiente.
En el panel Elegir configuración de destino, seleccione Reemplazar como método de Actualización. Seleccione Guardar configuración para volver al lienzo del flujo de datos.
Desde el lienzo del flujo de datos, puede transformar fácilmente los datos en función de sus requisitos empresariales. Por motivos de simplicidad, no estamos realizando ningún cambio en este tutorial. Para continuar, seleccione Guardar y ejecutar en la barra de herramientas.
Vuelva al área de trabajo y mantenga el puntero sobre el flujo de datos de dimensión del cliente , seleccione el menú ... y, a continuación, seleccione Actualizar ahora. Esta opción ejecuta el flujo de datos y mueve los datos del archivo de origen a la tabla de lago de datos. Mientras está en curso, verá un círculo giratorio junto al nombre del flujo de datos.
Una vez que se actualice el flujo de datos, seleccione su Lakehouse en la barra de menús superior para ver la tabla Delta dimension_customer.
Seleccione la tabla para obtener una vista previa de sus datos. También puede usar el punto de conexión de SQL Analytics del almacén de lago para consultar los datos con instrucciones SQL. Seleccione Punto de conexión de análisis SQL en el menú desplegable Almacén de lago de datos en la parte superior derecha de la pantalla.
Seleccione la tabla dimension_customer para obtener una vista previa de sus datos o seleccione Nueva consulta SQL para escribir las instrucciones SQL.
La siguiente consulta de ejemplo agrega el recuento de filas en función de la columna BuyingGroup de la tabla dimension_customer. Los archivos de consulta SQL se guardan automáticamente para futuras referencias y puede cambiar el nombre o eliminar estos archivos en función de sus necesidades.
Para ejecutar el script, seleccione el icono Ejecutar en la parte superior del archivo de script.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Agregar tablas al modelo semántico
En esta sección, agregará las tablas al modelo semántico para poder usarlas para crear informes.
Abra su lakehouse y cambie a la vista de punto de análisis de SQL, seleccione Nuevo modelo semántico, nombre el modelo semántico, asigne un área de trabajo y seleccione las tablas que desea agregar al modelo semántico. En este caso, seleccione la tabla dimension_customer.
Generación de un informe
En esta sección, creará un informe a partir de los datos ingeridos.
Seleccione el modelo semántico en el área de trabajo, seleccione la lista desplegable Explorar estos datos y, a continuación, seleccione Crear automáticamente un informe. En el siguiente tutorial, se crea un informe desde cero.
La tabla es una dimensión y no hay ninguna medida en ella. Power BI crea una medida para el recuento de filas, la agrega en distintas columnas y crea gráficos diferentes, como se muestra en la siguiente imagen.
Para guardar este informe en el futuro, seleccione Guardar en la cinta de opciones superior. Puede realizar más cambios en este informe para satisfacer sus necesidades si incluye o excluye otras tablas o columnas.