Introducción al tutorial de almacenamiento de datos
Se aplica a:✅ punto de conexión de análisis de SQL y Warehouse en Microsoft Fabric
Microsoft Fabric proporciona una tienda única para todas las necesidades analíticas de cada empresa. Abarca el espectro completo de servicios, como el movimiento de datos, el lago de datos, la ingeniería de datos, la integración de datos y la ciencia de datos, el análisis en tiempo real y la inteligencia empresarial. Con Microsoft Fabric, no es necesario unir diferentes servicios de varios proveedores. En su lugar, el cliente disfruta de un producto integral único, altamente integrado y fácil de entender, incorporar, crear y manejar. Ningún otro producto en el mercado ofrece la amplitud, profundidad y nivel de integración que ofrece Microsoft Fabric. Además, Microsoft Purview se incluye de forma predeterminada en cada inquilino para satisfacer las necesidades de cumplimiento y gobernanza.
Propósito de este tutorial
Aunque muchos conceptos de Microsoft Fabric pueden resultar familiares a los profesionales de datos y análisis, puede ser un reto aplicarlos en un nuevo entorno. Este tutorial se ha diseñado para recorrer paso a paso un escenario integral desde la adquisición de datos hasta el consumo de datos para crear una comprensión básica de la experiencia del usuario de Microsoft Fabric, las diversas experiencias y sus puntos de integración, y las experiencias del desarrollador profesional y usuario de a pie de Microsoft Fabric.
Los tutoriales no pretenden ser una arquitectura de referencia, una lista exhaustiva de características y funciones, ni una recomendación de procedimientos específicos.
Escenario de un extremo a otro del almacenamiento de datos
Como requisito previo para este tutorial, complete los pasos siguientes:
- Inicie sesión en su cuenta en línea de Power BI o, si aún no tiene una cuenta, regístrese para obtener una evaluación gratuita.
- Habilite Microsoft Fabric en el inquilino.
En este tutorial, asumirá el rol de un desarrollador de Warehouse en la empresa ficticia Wide World Importers y completará los siguientes pasos en el portal de Microsoft Fabric para compilar e implementar una solución de almacén de datos de un extremo a otro:
- Cree un área de trabajo de Microsoft Fabric.
- Cree un almacén.
- Ingiera datos del origen al modelo dimensional de almacenamiento de datos con una canalización de datos.
- Cree tablas en su Warehouse.
- Cargue datos con T-SQL con el editor de consultas SQL.
- Clone una tabla mediante T-SQL con el editor de consultas SQL.
- Transforme los datos para crear conjuntos de datos agregados mediante T-SQL.
- Viaje en el tiempo mediante T-SQL para ver los datos tal y como aparecían.
- Use el editor de consultas visuales para consultar el almacenamiento de datos.
- Analice los datos con un cuaderno.
- Cree y ejecute consultas entre almacenes con el editor de consultas SQL.
- Cree informes de Power BI mediante el modo DirectLake para analizar los datos en su lugar.
- Cree un informe desde el centro de datos de OneLake.
- Limpie los recursos eliminando el área de trabajo y otros elementos.
Arquitectura de un extremo a otro del almacenamiento de datos
Orígenes de datos: Microsoft Fabric facilita y agiliza la conexión a Azure Data Services, otras plataformas en la nube y orígenes de datos locales desde los que ingerir datos.
Ingesta: con más de 200 conectores nativos como parte de la canalización de Microsoft Fabric y con la transformación de arrastrar y colocar datos con flujo de datos, puede crear rápidamente información para su organización. Acceso directo es una nueva característica de Microsoft Fabric que proporciona una forma de conectarse a los datos existentes sin tener que copiarlos o moverlos. Puede encontrar más detalles sobre la característica Acceso directo más adelante en este tutorial.
Transformación y almacenamiento: Microsoft Fabric normaliza el formato Delta Lake, lo que significa que todos los motores de Microsoft Fabric pueden leer y trabajar en los mismos datos almacenados en OneLake, no es necesaria la replicación de datos. Este almacenamiento le permite crear un almacenamiento de datos o una malla de datos en función de sus necesidades organizativas. Para la transformación, puede elegir una experiencia de código bajo o sin código con canalizaciones o flujos de datos o usar T-SQL para una primera experiencia de código.
Consumo: los datos del almacenamiento pueden ser consumidos por Power BI, la herramienta de inteligencia empresarial líder del sector, para la elaboración de informes y su visualización. Cada almacenamiento incluye un punto de conexión TDS integrado para conectarse y consultar fácilmente datos de otras herramientas de informes, cuando sea necesario. Cuando se crea un almacenamiento, se genera un elemento secundario, denominado modelo semántico predeterminado, al mismo tiempo con el mismo nombre. Puede usar el modelo semántico predeterminado para empezar a visualizar datos con solo un par de pasos.
Datos de ejemplo
Para obtener datos de ejemplo, usamos la base de datos de ejemplo Wide World Importers (WWI). Para nuestro escenario de un extremo a otro del almacenamiento de datos, hemos generado datos suficientes para echar un vistazo a las funcionalidades de escala y rendimiento de la plataforma Microsoft Fabric.
Wide World Importers (WWI) es un importador y distribuidor mayorista de artículos de novedades que opera desde el área de la bahía de San Francisco. Como mayorista, los clientes de WWI principalmente son empresas que revenden a particulares. WWI vende a clientes minoristas de todos los Estados Unidos, incluyendo tiendas especializadas, supermercados, tiendas de informática, tiendas de atracciones turísticas y algunos particulares. WWI también vende a otros mayoristas a través de una red de agentes que promocionan los productos en nombre de WWI. Para más información sobre el perfil y el funcionamiento de la empresa, consulte Bases de datos de muestra de Wide World Importers para Microsoft SQL.
Normalmente, traería datos de sistemas transaccionales (o aplicaciones de línea de negocio) a un lago de datos o al área de almacenamiento provisional del almacenamiento de datos. Sin embargo, para este tutorial, usamos el modelo dimensional proporcionado por WWI como origen de datos inicial. Lo usamos como origen para ingerir los datos en un almacenamiento de datos y transformarlos a través de T-SQL.
Modelo de datos
Aunque el modelo dimensional de WWI contiene varias tablas de hechos, para este tutorial nos centramos en la tabla fact_sale
y sus dimensiones relacionadas, como se indica a continuación, para demostrar este escenario de almacenamiento de datos de un extremo a otro: