Compartir vía


Modelado dimensional en Microsoft Fabric Warehouse

Se aplica a: punto de conexión de análisis SQL y un almacén de Microsoft Fabric

Este artículo es el primero de una serie sobre el modelado dimensional dentro de un almacén. Ofrece instrucciones prácticas para Warehouse en Microsoft Fabric, que es una experiencia que admite muchas funcionalidades de T-SQL, como crear tablas y administrar datos en tablas. Por lo tanto, usted tiene control total sobre la creación de tablas de modelos dimensionales y la carga de datos.

Nota:

En este artículo, el término almacenamiento de datos hace referencia a un almacenamiento de datos empresarial, que ofrece una integración completa de los datos críticos de toda la organización. En cambio, el término independiente almacén hace referencia a Fabric Warehouse, que es una oferta de base de datos relacional de software como servicio (SaaS) que se puede usar para implementar un almacenamiento de datos. Para evitar malentendidos, en este artículo lo llamaremos Fabric Warehouse.

Sugerencia

Si no tiene experiencia con el modelado dimensional, considere que esta serie de artículos es el primer paso. No está pensada para ofrecer una explicación completa sobre el diseño del modelado dimensional. Para obtener más información, consulte directamente el contenido publicado con mayor difusión, como The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3ª edición, 2013) de Ralph Kimball y otros.

Diseño de esquema de estrella

El diseño de esquema de estrella es un enfoque de técnica de diseño de modelado dimensional por los almacenes de datos relacionales. Es un enfoque de diseño recomendado que se debe adoptar al crear un almacenamiento de tejido. Un esquema de estrella consta de tablas de hechos y tablas de dimensiones.

  • Las tablas de dimensiones describen las entidades pertinentes para los requisitos de análisis y organización. En general, representan las cosas que modela. Las cosas podrían ser productos, personas, lugares o cualquier otro concepto, incluidas fechas y horas. Para obtener más información y procedimientos recomendados de diseño, vea Tablas de dimensiones en esta serie.
  • Las tablas de hechos almacenan medidas asociadas a observaciones o eventos. Pueden almacenar pedidos de venta, saldos de existencias, tipos de cambio, lecturas de temperatura, etc. Las tablas de hechos contienen claves de dimensión junto con valores granulares que se pueden agregar. Para obtener más información y procedimientos recomendados de diseño, vea Tablas de hechos en esta serie.

Está optimizado un diseño de esquema de estrella para cargas de trabajo de consultas analíticas. Por este motivo, se considera un requisito previo para los modelos semánticos de Power BI empresarial. Las consultas analíticas se ocupan del filtrado, la agrupación, la ordenación y el resumen de datos. Se resumen los datos de hechos en el contexto de filtros y agrupaciones de las tablas de dimensiones relacionadas.

La razón por la que se denomina esquema de estrella es porque una tabla de hechos forma el centro de una estrella mientras que las tablas de dimensiones relacionadas forman los puntos de la estrella.

Diagrama que muestra una ilustración de un esquema de estrella para datos de ventas. Hay cinco dimensiones, cada una ubicada en un punto de la estrella.

Un esquema de estrella a menudo contiene varias tablas de hechos y, por tanto, varias estrellas.

Un esquema de estrella bien diseñado ofrece consultas de alto rendimiento (relacionales), ya que cuenta con menos combinaciones de tabla y mayor probabilidad de índices útiles. Además, un esquema de estrella suele requerir un mantenimiento bajo a medida que evoluciona el diseño del almacenamiento de datos. Por ejemplo, agregar una nueva columna a una tabla de dimensiones para admitir el análisis de un nuevo atributo es una tarea relativamente sencilla. A medida que se agregan hechos nuevos y dimensiones conforme evoluciona el ámbito del almacenamiento de datos.

Periódicamente, quizás diariamente, las tablas de un modelo dimensional se actualizan y cargan mediante un proceso de extracción, transformación y carga de datos (ETL). Este proceso sincroniza sus datos con los sistemas de origen, que almacenan datos operativos. Para más información, vea Carga de tablas en esta serie.

Modelado dimensional para Power BI

En el caso de las soluciones empresariales, un modelo dimensional de Fabric Warehouse es un requisito previo recomendado para crear un modelo semántico de Power BI. El modelo dimensional no solo admite el modelo semántico, sino que también es un origen de datos para otras experiencias, como los modelos de Machine Learning.

Sin embargo, en circunstancias específicas podría no ser el mejor enfoque. Por ejemplo, los analistas de autoservicio que necesitan libertad y agilidad para actuar rápidamente, y sin tener dependencia en TI, podrían crear modelos semánticos que se conecten directamente a los datos de origen. En tales casos, la teoría del modelado dimensional sigue siendo relevante. Esa teoría ayuda a los analistas a crear modelos intuitivos y eficientes, a la vez que evita la necesidad de crear y cargar un modelo dimensional en un almacenamiento de datos. En su lugar, se puede crear un modelo cuasidimensional mediante Power Query, que define la lógica a la que conectarse y transformar los datos de origen para crear y cargar las tablas del modelo semántico. Para más información, vea Descripción de un esquema de estrella e importancia para Power BI.

Importante

Cuando se usa Power Query para definir un modelo dimensional en el modelo semántico, no se puede administrar el cambio histórico, lo que podría ser necesario para analizar el pasado con precisión. Si es un requisito, debe crear un almacenamiento de datos y permitir que los procesos ETL periódicos capturen y almacenen correctamente los cambios de dimensión.

Planeamiento de un almacenamiento de datos

Debe abordar la creación de un almacenamiento de datos y el diseño de un modelo de dimensión como una tarea seria e importante. Esto se debe a que el almacenamiento de datos es uno de los componentes principales de la plataforma de datos. Debe formar una base sólida que admita análisis e informes (y, por tanto, la toma de decisiones) para toda la organización.

Para ello, el almacenamiento de datos debe esforzarse por almacenar datos de calidad, conformes e históricamente precisos como una versión única de la verdad. Debe proporcionar datos comprensibles y navegables con un rendimiento rápido y aplicar permisos para que solo puedan acceder a los datos adecuados las personas que usted elija. Se esfuerza por diseñar el almacenamiento de datos para lograr resistencia, lo que le permite adaptarse a los cambios a medida que evolucionan los requisitos.

La implementación correcta de un almacenamiento de datos depende de una buena planificación. Para obtener información sobre consideraciones estratégicas y tácticas, y elementos de acción que conducen a la adopción correcta de Fabric y el almacenamiento de datos, consulte la hoja de ruta de adopción de Microsoft Fabric.

Sugerencia

Se recomienda compilar el almacenamiento de datos de la empresa de forma iterativa. Comience primero con las áreas temáticas más importantes y, a lo largo del tiempo, según la prioridad y los recursos, amplíe el almacenamiento de datos con otras áreas temáticas.

En el siguiente artículo de esta serie, obtenga información sobre instrucciones y procedimientos recomendados de diseño para tablas de dimensiones.