Implementación de procedimientos recomendados de modelado de datos de Power BI

Completado

La implementación de procedimientos recomendados de modelado de datos es clave para modelos de datos escalables y eficaces.

Elección del marco de modelo de Power BI correcto

Elegir el marco de modelo de Power BI correcto es el núcleo de la creación de cualquier solución escalable.

El primer lugar para empezar con el modelo de datos de Power BI es el modo de importación. El modo de importación le ofrece la mayor cantidad de opciones y flexibilidad de diseño, y ofrece un rendimiento rápido.

Use DirectQuery cuando el origen de datos almacene grandes volúmenes de datos o sea necesario proporcionar en el informe datos casi en tiempo real.

Por último, use un modelo compuesto cuando necesite:

  • Aumentar el rendimiento de las consultas de un modelo de DirectQuery.
  • Ofrecer resultados de consulta casi en tiempo real a partir de un modelo de importación.
  • Ampliar un conjunto de datos de Power BI (o el modelo Azure Analysis Services) con otros datos.

Los modelos compuestos combinan datos de más de un origen de DirectQuery o combinan DirectQuery con datos de importación.

Importante

Revise el módulo Elección de un marco de modelos de Power BI para más información sobre el uso de modelos de importación, DirectQuery o compuestos.

Implementación de procedimientos recomendados de modelado de datos

Hay algunos principios básicos que deben cumplirse al crear cualquier modelo de datos. Estos principios se vuelven aún más importantes a medida que los datos comienzan a crecer.

Lo más importante es que desee realizar el máximo trabajo de preparación de datos posible antes de que los datos lleguen a Power BI, en la medida de lo posible. Por ejemplo, si tiene la oportunidad de transformar datos en el almacenamiento de datos, es donde debe realizarse. La transformación en el origen produce coherencia con cualquier otra solución basada en esos datos y garantiza que el modelo de Power BI no tenga que realizar ningún procesamiento adicional. Esto puede requerir trabajar con el ingeniero de datos u otros miembros del equipo de datos y es fundamental.

Procedimientos recomendados para el modo de importación:

  • Si es posible, comience siempre con el modo de importación.
  • Incorpore solo los datos que necesite.
    • Quite las filas y columnas innecesarias.
    • Solo procese lo que sea absolutamente necesario (tablas o particiones) según los requisitos empresariales.
  • Evite tablas anchas.
    • Use un esquema de estrella en Power BI.
      • Si el origen es un almacenamiento de datos muy modelado, va un paso por delante.
      • Los macrodatos suelen estar en tablas planas anchas. Aproveche las ventajas de rendimiento de los modelos dimensionales.
      • Power BI admite varias tablas de hechos con dimensiones y granularidades diferentes: no es necesario colocar todo en una tabla grande.
  • Agregue previamente los datos antes de cargarlos en el modelo siempre que sea posible.
  • Reduzca el uso de columnas calculadas.
    • Las transformaciones de datos que requieren columnas adicionales deben realizarse lo más cerca posible del origen.
  • Evite columnas de cardinalidad alta.
    • Considere la posibilidad de dividir una columna datetime en dos columnas, una para la fecha y otra para la hora.
  • Use el tipo de datos adecuado.
    • Use enteros en lugar de cadenas para las columnas de id.
    • Use claves suplentes para las columnas de id. si fuera necesario.
  • Limite el uso de filtros bidireccionales en las relaciones.
  • Deshabilite la fecha y hora automáticas.
    • Conéctese a una tabla de fechas en el origen o cree su propia tabla de fechas.
  • Deshabilite las jerarquías de atributos para las columnas que no son de atributo.
  • Si consulta una base de datos relacional, consulte las vistas de base de datos en lugar de tablas.
    • Una vista proporciona una capa de abstracción para administrar columnas y se relaciona con la primera consideración, insertando transformaciones lo más cerca posible del origen.
    • Las vistas no deben contener lógica. Solo deben contener una instrucción SELECT de una tabla.
  • Considere la creación de particiones y la actualización gradual para evitar cargar datos que no sean necesarios.
  • Compruebe para asegurarse de que se logra el plegado de consultas.
    • Si el plegado de consultas no es posible, tiene otra oportunidad de trabajar con el ingeniero de datos para mover la transformación ascendente.

Procedimientos recomendados específicos del modo DirectQuery:

  • Establezca las relaciones para aplicar la integridad mediante la propiedad Asumir integridad referencial en las relaciones.
    • La configuración Asumir integridad referencial en las relaciones permite que las consultas usen instrucciones COMBINACIÓN INTERNA en lugar de COMBINACIÓN EXTERNA.
  • Limite el uso de filtros bidireccionales en las relaciones.
    • Úselo solo cuando sea necesario.
  • Limite la complejidad de los cálculos DAX.
    • Dado que el plegado de consultas se produce de forma predeterminada en DirectQuery, las medidas DAX más complejas implican una complejidad adicional en el origen, lo que produce consultas lentas.
    • La necesidad de DAX compleja también conduce al principio clave de la aplicación de transformaciones en la medida de lo posible. Es posible que tenga que trabajar con el ingeniero de datos para aplicar transformaciones en el origen.
  • Evite el uso de columnas calculadas.
    • Las transformaciones que requieren columnas adicionales deben realizarse lo antes posible, especialmente cuando se usa DirectQuery.
  • Evite relaciones en las columnas calculadas
  • Evite relaciones en columnas de identificador único
  • Use el modo de almacenamiento dual para las dimensiones relacionadas con las tablas de hechos que se encuentran en DirectQuery.

Nota

Consulte la Guía del modelo DirectQuery para obtener una lista completa de las consideraciones sobre el desarrollo de modelos DirectQuery.

También hay una herramienta que puede usar al desarrollar modelos tabulares que le avisa de errores de modelado o cambios que mejoran el diseño y el rendimiento del modelo. El Analizador de procedimientos recomendados en el Editor tabular se diseñó para ayudarle a diseñar modelos que cumplan los procedimientos recomendados de modelado.

En la unidad siguiente, aprenderá a configurar el formato de almacenamiento de conjunto de datos grande mediante Power BI Premium.