Поделиться через


Шпаргалка по Power BI

На этой странице приведены четкие рекомендации по эффективному управлению данными в Power BI и Azure Databricks для оптимизации производительности запросов и создания эффективных панелей мониторинга.

Подключение Azure Databricks и Power BI

Лучшие практики Воздействие Docs
Использование параметров Power BI при подключении к разным средам Azure Databricks Обеспечивает гибкость при подключении к разным рабочим областям Azure Databricks или разным хранилищам SQL Azure Databricks.
Используйте функциональность публикации Azure Databricks для службы Power BI Обеспечивает простую интеграцию каталогов и синхронизацию модели данных без выхода из пользовательского интерфейса Azure Databricks.
Использование автоматической публикации Azure Databricks в Power BI Публикация наборов данных из каталога Unity в Power BI непосредственно из конвейеров данных.

Выбор наиболее подходящего режима хранения

Лучшие практики Воздействие Docs
Используйте DirectQuery для таблиц фактов и Dual для таблиц измерений (не Import) Создайте более эффективные запросы SQL с помощью наиболее подходящего режима хранения.
Предпочитайте DirectQuery вместо импорта, когда это возможно Позволяет поддерживать управление и слышимость.
Использование составных моделей для смешанных режимов хранения Разрешает смешанное использование таблиц режимов DirectQuery, Dual, Import, а также таблиц агрегирования и гибридных таблиц.
Использование гибридных таблиц для агрегированных исторических данных с данными в режиме реального времени Обеспечивает высокоэффективные запросы в оперативной памяти.

Оптимизация доступа к данным

Лучшие практики Воздействие Docs
Использование агрегатов, определяемых пользователем Повышает производительность запросов по большим семантических моделях DirectQuery путем кэширования предварительно агрегированных данных.
Использование автоматических агрегаций Непрерывно оптимизирует семантические модели DirectQuery, создавая агрегаты на основе журнала запросов для максимальной производительности отчета.
Используйте секционирование таблиц или инкрементное обновление Позволяет быстрее импортировать данные и управлять большими наборами данных, особенно для очень небольших, статических и конфиденциальных отчетов о производительности (менее 2 секунд).
Добавить кнопки Применить все срезы и Очистить все срезы Предотвращает ненужные запросы путем использования параметров сокращения запросов при взаимодействии пользователей с фильтрами отчетов.
Используйте предполагаемую целостность ссылочной информации при определении связей таблиц, если целостность ссылочной информации была проверена на стадии загрузки данных. Обеспечивает более эффективные стратегии присоединения в запросах SQL.

Настройка модели данных

Лучшие практики Воздействие Docs
Преобразования «Переместить влево» Представления SQL используют возможности обработчика SQL Databricks для более эффективного выполнения отчетов по сравнению с преобразованиями PowerQuery и формулами DAX.
Если необходимо использовать формулы DAX, оптимизируйте формулы DAX и избегайте больших результирующих наборов. Предотвращает неэффективные вычисления, которые приводят к ухудшению производительности
Избегайте вычисляемых столбцов DAX и вычисляемых таблиц в семантических моделях и определяйте эти данные непосредственно в таблицах Gold. Предварительно вычисляемые метрики лучше всего работают в слое Gold
Для DirectQuery проверьте параметры конфигурации параллелизации запросов Улучшает параллелизацию запросов и повышает эффективность использования хранилища SQL для повышения общей производительности.
Для DirectQuery проверьте, сколько запросов Power BI может отправлять параллельно в Azure Databricks Гарантирует, что хранилище SQL Databricks имеет соответствующий размер для обработки требуемого уровня параллелизма, чтобы избежать очередей запросов, что приводит к медленному отчету.

Мониторинг производительности и метрик

Лучшие практики Воздействие Docs
Использование Анализатора производительности Power BI для проверки производительности элемента отчета Идентифицирует визуализацию, которая требует больше всего времени для загрузки и где находится узкое место.
Оцените следующие свойства семантических моделей Power BI:
  • Максимальное количество подключений к источнику данных
  • Максимальное число одновременных оценок
  • Максимальное количество параллельных заданий
  • MaxParallelismPerQuery
Точно настраивает производительность модели.