Determinación de cuándo desarrollar un modelo de importación

Completado

Un modelo de importación consta de tablas que tienen su propiedad de modo de almacenamiento establecida en Importar. También incluye tablas calculadas, que se definen con una fórmula DAX.

Ventajas del modelo de importación

Los modelos de importación son el marco de modelo desarrollado con más frecuencia, ya que hay muchas ventajas. Modelos de importación:

  • Admiten todos los tipos de origen de datos de Power BI, incluidas bases de datos, archivos, fuentes, páginas web, flujos de datos, etc.
  • Pueden integrar los datos de origen. Por ejemplo, una tabla obtiene sus datos de una base de datos relacional mientras que otra tabla relacionada obtiene sus datos de una página web.
  • Admiten todas las funcionalidades DAX y Power Query (M).
  • Admiten tablas calculadas.
  • Ofrecen el mejor rendimiento de las consultas. Esto se debe a que los datos almacenados en caché en el modelo están optimizados para consultas analíticas (filtro, grupo y resumen) y el modelo se almacena completamente en memoria.

En resumen, los modelos de importación ofrecen la mayoría de las opciones y flexibilidad de diseño, además de un rendimiento rápido. Por este motivo, Power BI Desktop usa de forma predeterminada el modo de almacenamiento de importación al obtener datos.

Diagram shows a star schema import model that loads data from different data source types, including a relational database, an Excel workbook, a social media feed, and a Power B I dataflow.

Limitaciones del modelo de importación

A pesar de las muchas ventajas atractivas, los modelos de importación también presentan limitaciones que es necesario tener en cuenta. Las limitaciones están relacionadas con el tamaño del modelo y la actualización de datos.

Tamaño del modelo

Power BI impone restricciones de tamaño del conjunto de datos, que limitan el tamaño de un modelo. Al publicar el modelo en una capacidad compartida, hay un límite de 1 GB por conjunto de datos. Cuando se supere este límite de tamaño, el conjunto de datos no se actualizará. Cuando se publica el modelo en una capacidad dedicada (también conocida como capacidades Premium), puede crecer por encima de los 10 GB, siempre que se habilite el valor de formato de almacenamiento de conjuntos de datos grandes para la capacidad.

Siempre debe esforzarse por reducir la cantidad de datos almacenados en tablas. Esta estrategia ayuda a reducir la duración de las actualizaciones del modelo y acelerar las consultas del modelo. Hay numerosas técnicas de reducción de datos que puede aplicar, entre las que se incluyen:

  • Quitar columnas innecesarias
  • Quitar filas innecesarias
  • Agrupar por y resumir para aumentar el detalle de las tablas de hechos.
  • Optimizar los tipos de datos de columna con una preferencia para los datos numéricos.
  • Dar preferencia a columnas personalizadas en Power Query en lugar de a las columnas calculadas en el modelo.
  • Deshabilitar la carga de consultas de Power Query
  • Deshabilitar fecha y hora automáticas
  • Usar el almacenamiento de tablas de DirectQuery, como se describe en unidades posteriores de este módulo.

Para obtener más información, vea Técnicas de reducción de datos para modelos de importación.

Nota

El límite de 1 GB por conjunto de datos hace referencia al tamaño comprimido del modelo de Power BI, no al volumen de datos que se recopilan del sistema de origen.

Actualización de datos

Los datos importados deben actualizarse periódicamente. Los datos del conjunto de datos son tan actuales como la última actualización de datos realizada con éxito. Para mantener los datos actualizados, configure la actualización de datos programada; también, los consumidores de informes pueden realizar una actualización a petición.

Power BI impone límites sobre la frecuencia con la que pueden producirse las operaciones de actualización programadas. Es de hasta ocho veces al día en una capacidad compartida y hasta 48 veces al día en una capacidad dedicada.

Debe determinar si este grado de latencia es tolerable. A menudo depende de la velocidad (o volatilidad) de los datos y de la urgencia de mantener a los usuarios informados sobre el estado actual de los datos. Cuando los límites de actualización programados no son aceptables, considere la posibilidad de usar tablas de almacenamiento de DirectQuery o de crear una tabla híbrida. O bien, adopte otro enfoque y cree un conjunto de datos en tiempo real.

Sugerencia

Las tablas híbridas se describen en la unidad 4. Para información sobre los conjuntos de datos en tiempo real, trabaje con el módulo Supervisión de datos en tiempo real con Power BI.

También debe considerar la posibilidad de actualizar la carga de trabajo y la duración. De forma predeterminada, para actualizar una tabla, Power BI quita todos los datos y vuelve a cargarlos. Estas operaciones pueden poner una carga inaceptable en los sistemas de origen, especialmente en el caso de tablas de hechos de gran tamaño. Para reducir esta carga, puede configurar la característica de actualización incremental. La actualización incremental automatiza la creación y administración de particiones de período de tiempo y actualiza de forma inteligente solo las particiones que requieren actualización.

Cuando el origen de datos admite la actualización incremental, puede dar lugar a actualizaciones más rápidas y confiables y a un menor consumo de recursos de Power BI y sistemas de origen.

Los modeladores de datos avanzados pueden personalizar su propia estrategia de creación de particiones. Los scripts de Automation pueden crear, administrar y actualizar las particiones de tabla. Para más información, consulte Escenarios de uso de Power BI: Administración avanzada de modelos de datos. En este escenario se describe el uso del punto de conexión XMLA disponible con Power BI Premium.