Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta página se proporcionan instrucciones claras y fundamentadas para administrar eficazmente los datos en Power BI y Azure Databricks para optimizar el rendimiento de las consultas y crear paneles eficaces.
Conexión de Azure Databricks y Power BI
| Procedimiento recomendado | Impacto | Docs |
|---|---|---|
| Uso de parámetros de Power BI al conectarse a distintos entornos de Azure Databricks | Permite flexibilidad al conectarse a diferentes áreas de trabajo de Azure Databricks o a almacenes sql de Azure Databricks. | |
| Uso de la funcionalidad de publicación de Azure Databricks en el servicio Power BI | Habilita la integración sin problemas del catálogo y la sincronización del modelo de datos sin salir de la interfaz de usuario de Azure Databricks. | |
| Uso de la publicación automática de Azure Databricks en Power BI | Publique conjuntos de datos desde el catálogo de Unity en Power BI directamente desde canalizaciones de datos. |
Elección del modo de almacenamiento más adecuado
| Procedimiento recomendado | Impacto | Docs |
|---|---|---|
| Usa DirectQuery para las tablas de hechos y Dual para las tablas de dimensiones (no importes) | Genere consultas SQL más eficaces mediante el modo de almacenamiento más adecuado. | |
| Preferir DirectQuery sobre la importación siempre que sea posible | Permite mantener la gobernanza y la audibilidad. | |
| Uso de modelos compuestos para modos de almacenamiento mixto | Permite el uso mixto de las tablas DirectQuery, Dual, Modo de importación, de agregación y tablas híbridas. | |
| Uso de tablas híbridas para datos históricos agregados con datos en tiempo real | Habilita consultas en memoria eficaces. |
Optimización del acceso a datos
| Procedimiento recomendado | Impacto | Docs |
|---|---|---|
| Uso de agregaciones definidas por el usuario | Mejora el rendimiento de las consultas en los modelos semánticos de DirectQuery de gran tamaño mediante el almacenamiento en caché de datos agregados previamente. | |
| Uso de agregaciones automáticas | Optimiza continuamente los modelos semánticos de DirectQuery mediante la creación de agregaciones basadas en el historial de consultas para obtener el máximo rendimiento del informe. | |
| Utilice la partición de tablas o la actualización incremental | Permite importar datos más rápido y administrar conjuntos de datos más grandes, especialmente para informes muy pequeños, estáticos y sensibles al rendimiento (menos de 2 segundos). | |
| Agregar Aplicar todos los filtros y Borrar todos los filtros botones | Evita consultas innecesarias aprovechando la configuración de reducción de consultas cuando los usuarios interactúan con filtros de informe. | |
| Usar Asumir integridad referencial al definir relaciones de tabla si la integridad referencial ha sido validada en la ingesta previa. | Permite estrategias de combinación más eficaces en consultas SQL. |
Ajuste del modelo de datos
| Procedimiento recomendado | Impacto | Docs |
|---|---|---|
| Transformaciones de "Mover hacia la izquierda" | Las vistas SQL aprovechan la eficacia del motor de SQL de Databricks para una ejecución de informes más eficaz en comparación con las transformaciones de PowerQuery y las fórmulas DAX. | |
| Si debe usar fórmulas DAX, optimice las fórmulas DAX y evite grandes conjuntos de resultados. | Evita cálculos ineficaces que conducen a un rendimiento deteriorado | |
| Evite las columnas calculadas DAX y las tablas calculadas en los modelos semánticos y defina estos datos directamente en las tablas Gold. | Las medidas precomputadas funcionan mejor en la capa de oro | |
| Para DirectQuery, compruebe si hay opciones de configuración de paralelización de consultas. | Mejora la paralelización de consultas y maximiza el uso de SQL Warehouse para mejorar el rendimiento general. | |
| Para DirectQuery, compruebe cuántas consultas puede enviar Power BI en paralelo a Azure Databricks. | Garantiza que Databricks SQL Warehouse esté dimensionado según corresponda para manejar el nivel necesario de paralelismo y evitar que las consultas hagan cola, lo que da lugar a una respuesta lenta. |
Supervisión del rendimiento y las métricas
| Procedimiento recomendado | Impacto | Docs |
|---|---|---|
| Uso de Power BI Performance Analyzer para examinar el rendimiento del elemento de informe | Identifica la visualización que tarda más en cargarse y dónde está el cuello de botella. | |
Evalúe las siguientes propiedades de los modelos semánticos de Power BI:
|
Ajusta el rendimiento del modelo. |