Определение времени разработки модели импорта

Завершено

Модель Import состоит из таблиц, для которых свойству режима хранения присвоено значение Import. Она также включает вычисляемые таблицы, которые определяются с помощью формулы DAX.

Преимущества модели импорта

Модели импорта — это наиболее часто разрабатываемая платформа моделей ввиду множества ее преимуществ. Модели импорта:

  • поддерживают все типы источников данных Power BI, включая базы данных, файлы, веб-каналы, веб-страницы, потоки данных и многое другое;
  • могут интегрировать исходные данные; например, одна таблица получает данные из реляционной базы данных, а связанная таблица — данные с веб-страницы;
  • поддерживают все функции DAX и Power Query (M);
  • поддерживают вычисляемые таблицы;
  • обеспечивают оптимальную производительность запросов. Это связано с тем, что данные, кэшированные в модели, оптимизированы для аналитических запросов (фильтрация, группировка и суммирование), а модель полностью хранится в памяти.

Если говорить кратко, модели импорта предлагают наиболее широкие возможности и гибкость проектирования, а также обеспечивают быструю производительность. По этой причине в Power BI Desktop при получении данных по умолчанию используется режим хранения "Импорт".

Diagram shows a star schema import model that loads data from different data source types, including a relational database, an Excel workbook, a social media feed, and a Power B I dataflow.

Ограничения модели импорта

Несмотря на множество убедительных преимуществ, в моделях импорта существуют и ограничения, которые необходимо учитывать. Ограничения связаны с размером модели и обновлением данных.

Размер модели

Power BI накладывает ограничения на размер набора данных, ограничивающие размер модели. При публикации модели в общей емкости существует ограничение в 1 ГБ на набор данных. При превышении этого ограничения размер набора данных обновить не удастся. При публикации модели в выделенной емкости (также известной как емкость Premium), ее размер может увеличиться до 10 ГБ, если для емкости включен параметр Формат хранения крупных наборов данных.

Всегда следует стремиться уменьшить объем данных, хранящихся в таблицах. Эта стратегия помогает сократить продолжительность обновления модели и ускорить запросы модели. Существует множество методов сокращения данных, которые можно применить, в том числе следующие:

  • Удаление ненужных столбцов
  • Удаление ненужных строк
  • Группирование и суммирование для повышения уровня детализации таблиц фактов
  • Оптимизация типов данных столбцов с предпочтением числовых данных
  • Использование настраиваемых столбцов в Power Query вместо вычисляемых столбцов в модели
  • Отключение загрузки запроса Power Query
  • Отключение автоматической даты и времени
  • Используйте хранилище таблиц DirectQuery, как описано в последующих уроках этого модуля.

Дополнительные сведения см. в статье Методы уменьшения объема данных для моделирования импорта.

Примечание.

Ограничение в 1 ГБ на набор данных означает сжатый размер модели Power BI, а не объем данных, собираемых из исходной системы.

Обновление данных

Импортированные данные должны периодически обновляться. Данные в наборе данных считаются актуальными только после последнего успешного обновления данных. Чтобы сохранить данные в актуальном состоянии, необходимо настроить запланированное обновление данных, либо потребители отчетов могут выполнять обновление по запросу.

Power BI накладывает ограничения на периодичность выполнения запланированных операций обновления: не более восьми раз в день в общей емкости и не более 48 раз в день в выделенной емкости.

Необходимо определить, допускается ли такая степень задержки. Зачастую это зависит от скорости (или волатильности) данных, а также от срочности информирования пользователей о текущем состоянии данных. Если ограничения на запланированное обновление недопустимы, рассмотрите возможность использования таблиц хранения DirectQuery или создания гибридной таблицы. Либо воспользуйтесь другим подходом и создайте набор данных в режиме реального времени.

Совет

Гибридные таблицы описаны в уроке 4. Сведения о наборах данных в режиме реального времени см. в модуле Мониторинг данных в режиме реального времени с помощью Power BI.

Также необходимо учитывать рабочую нагрузку и ее продолжительность. По умолчанию для обновления таблицы служба Power BI удаляет все данные и повторно загружает их. Эти операции могут наложить неприемлемые ограничения на исходные системы, особенно для больших таблиц фактов. Чтобы устранить эти ограничения, можно настроить функцию добавочного обновления. Добавочное обновление автоматизирует создание секций периода времени и управление ими, а также интеллектуально обновляет только те секции, которые требуют обновления.

Если источник данных поддерживает добавочное обновление, это может привести к более быстрому и надежному обновлению и снижению потребления ресурсов Power BI и исходных систем.

Опытные разработчики моделей данных могут настроить собственную стратегию секционирования. С помощью скриптов автоматизации можно создавать секции таблиц, управлять ими и обновлять их. Дополнительные сведения см. в разделе Сценарии использования Power BI: расширенное управление моделями данных. В этом сценарии описывается использование конечной точки XMLA, доступной в Power BI Premium.