Описание основных принципов модели Power BI

Завершено

В этом блоке рассматриваются термины модели Power BI. Важно понимать эти термины, чтобы выбрать подходящую платформу модели для проекта. В этом модуле описываются следующие термины:

  • Модель данных
  • в наборе данных Power BI
  • Аналитический запрос
  • Табличная модель
  • Структура схемы типа "звезда"
  • Режим хранения таблиц
  • Платформа моделей

Модель данных

Модель данных Power BI — это ресурс данных с поддержкой запросов, оптимизированный для аналитики. Отчеты могут отправлять запросы к моделям данных с использованием одного из двух языков аналитики: выражений анализа данных (DAX) или многомерных выражений (MDX). Power BI использует DAX, а отчеты с разбивкой на страницы могут использовать DAX или MDX. Функция "Анализировать в Excel" использует MDX.

Совет

Модель данных также описывается как семантическая модель, особенно в корпоративных сценариях. Как правило, в контексте обсуждения данных и в этом модуле модель данных называется просто моделью.

в наборе данных Power BI

Вы разрабатываете модель Power BI в Power BI Desktop, и после публикации в рабочей области в службе Power BI она называется набором данных. Набор данных — это артефакт Power BI, который является источником данных для визуализаций в отчетах и панелях мониторинга Power BI.

Примечание.

Не все наборы данных создаются в моделях, разработанных в Power BI Desktop. Некоторые наборы данных представляют подключения к внешним моделям в AAS или SSAS. Другие могут представлять структуры данных в режиме реального времени, включая наборы данных push-передачи, наборы данных потоковой передачи или гибридные наборы данных. Этот модуль относится только к моделям, разработанных в Power BI Desktop.

Аналитический запрос

Отчеты и панели мониторинга Power BI должны отправлять запрос к набору данных. Когда Power BI визуализирует данные из набора данных, он подготавливает и отправляет аналитический запрос. Аналитический запрос создает результат запроса на основе модели, которую легко может понять человек, особенно во время визуализации.

Аналитический запрос состоит из трех этапов, которые выполняются в следующем порядке.

  1. Фильтр
  2. Групповой
  3. Сводка

Фильтрация (иногда называемая созданием среза) сужает подмножество данных модели. Значения фильтра не отображаются в результатах запроса. Большинство аналитических запросов применяют фильтры, так как обычно фильтруется по периоду времени и, как правило, по другим атрибутам. Фильтрация выполняется разными способами. В отчете Power BI можно задать фильтры на уровне отчета, страницы или визуального элемента. Макеты отчетов часто включают визуальные элементы средства создания среза для фильтрации визуальных элементов на странице отчета. Когда модель обеспечивает безопасность на уровне строк (RLS), она применяет фильтры к таблицам моделей, чтобы ограничить доступ к определенным данным. Меры, которые суммируют данные модели, также могут применять фильтры.

Группирование (иногда называемое разделением) разделяет результат запроса на группы. Каждая группа также является фильтром, но в отличие от этапа фильтрации, значения фильтров отображаются в результатах запроса. Например, группирование по клиентам фильтрует каждую группу по клиенту.

Суммирование создает результат с одним значением. Как правило, визуальный элемент отчета суммирует числовое поле с помощью агрегатной функции. К агрегатным функциям относятся функции sum, count, minimum, maximum и др. Вы можете обеспечить простое суммирование путем агрегирования столбца или создания сложного суммирования путем создания меры с помощью формулы DAX.

Рассмотрим пример: страница отчета Power BI включает средство создания среза для фильтрации по одному году. Существует также визуальный элемент гистограммы, демонстрирующий квартальные продажи за выбранный в фильтре год.

Screenshot of the Power BI report described in the previous paragraph.

В этом примере средство создания среза выполняет фильтрацию визуального элемента по календарному 2021 году. Гистограмма выполняет группирование по кварталам (выбранного при фильтрации года). Каждый столбец представляет собой группу, представляющую видимый фильтр. Высота столбцов представляет суммированные значения продаж для каждого квартала выбранного в фильтре года.

Табличная модель

Модель Power BI — это табличная модель. Табличная модель состоит из одной или нескольких таблиц столбцов. Она также может включать связи, иерархии и вычисления.

Структура схемы типа "звезда"

Чтобы создать оптимизированную и простую в использовании табличную модель, рекомендуется создать схему типа "звезда". Схема типа "звезда" — это зрелый подход к моделированию, широко применяемый в реляционных хранилищах данных. Он требует классификации таблиц моделей как измерений или фактов.

Таблицы измерений описывают бизнес-сущности — то, что вы моделируете. Сущности могут включать продукты, люди, места и понятия, включая время. В таблицах фактов хранятся наблюдения или события. Это могут быть, например, заказы на продажу, остатки запасов, обменные курсы, значения или показатели температуры. Таблица фактов содержит ключевые столбцы измерения, относящиеся к таблицам измерений и числовым столбцам мер. Таблица фактов образует центр звезды, а связанные таблицы измерений — точки звезды.

Screenshot of a star schema design with a fact table in the center and dimension tables forming the points of the star.

В аналитическом запросе это фильтр или группа столбцов таблицы измерений. Столбцы таблицы фактов суммируются.

Дополнительные сведения см. в статье "Общие сведения о схеме звезды" и важности для Power BI.

Режим хранения таблиц

Каждая таблица модели Power BI (за исключением вычисляемых таблиц) имеет свойство режима хранения. Свойство режима хранения может иметь значение Import, DirectQuery или Dual, а также определяет, хранятся ли данные таблицы в модели.

  • Import — запросы извлекают данные, которые хранятся или кэшируются в модели.
  • DirectQuery — запросы передаются в источник данных.
  • Dual — запросы извлекают сохраненные данные или передаются в источник данных. Power BI определяет наиболее эффективный план, пытаясь по возможности использовать кэшированные данные.

Платформа моделей

Параметры режима хранения таблиц определяют платформу модели, которая может быть Import, DirectQuery или Composite. В следующих блоках этого модуля описываются все эти платформы и приводятся рекомендации по их использованию.

  • Модель Import состоит из таблиц, для которых свойству режима хранения присвоено значение Import.
  • Модель DirectQuery состоит из таблиц, для которых свойство режима хранения имеет значение DirectQuery, и они принадлежат к одной исходной группе. Исходная группа описана далее в этом модуле.
  • Составная модель состоит из нескольких исходных групп.