Руководство. Структура для пользователей Power BI

В этом руководстве вы узнаете, как использовать потоки данных 2-го поколения и конвейеры для приема данных в Lakehouse и создания трехмерной модели. Вы также узнаете, как создать красивый отчет автоматически, чтобы отобразить последние цифры продаж от начала до окончания всего 45 минут.

Давайте приступим!

  • Подготовка и загрузка данных в lakehouse
  • Создание мерной модели в лейкхаусе
  • Автоматическое создание отчета с помощью быстрого создания

Необходимые компоненты

Создание lakehouse для хранения данных

Начнем с создания lakehouse для хранения данных, потоков данных 2-го поколения для подготовки и преобразования столбцов, а также конвейера для обработки оркестрации запланированного обновления и действия электронной почты.


  1. Перейдите в рабочую область и нажмите кнопку "Создать". Затем выберите "Показать все".

    Screenshot of the Show all option in the new item menu.

  2. На экране создания нового элемента выберите Lakehouse в категории "Инженерия данных".

    Screenshot of Data engineering items.

  3. Задайте имя Lakehouse в SalesLakehouse. Затем выберите Создать.

    Screenshot of naming a name Lakehouse.

  4. Когда вы находитесь в редакторе Lakehouse, выберите Новый поток данных 2-го поколения.

    Примечание.

    Вы также можете выбрать " Получить данные " на ленте, а затем создать поток данных 2-го поколения.

    Screenshot of Get data drop down in the Lakehouse editor.

Подготовка и загрузка данных в lakehouse

Чтобы загрузить данные в lakehouse, сделайте следующее:

  1. Когда вы находитесь в редакторе Power Query Online для потоков данных 2-го поколения, выберите импорт из шаблона Power Query и выберите файл шаблона, скачанный из предварительных требований.

    Screenshot of watermarks in the Dataflows Gen2 editor.

  2. Выберите запрос DimDate в группе запросов загрузки данных и выберите параметр "Настройка подключения". При необходимости задайте для типа проверки подлинности анонимный перед выбором Подключение.

    Screenshot of the configure connection menu.

  3. При выборе запроса DimDate в окне предварительного просмотра данных измените тип данных столбца DateKey на date/Time, выбрав значок в левом верхнем углу.

    Screenshot of changing data types within the Power Query editor.

  4. Выберите "Заменить текущий" в окне "Изменить тип столбца".

    Screenshot of the change column type menu.

Добавление назначения данных

Чтобы добавить назначение данных, сделайте следующее:

  1. Выбрав таблицу DimDate, на вкладке "Главная" выберите "Добавить назначение данных" и выберите пункт меню "Лейкхаус".

    Screenshot of the get data destination Lakehouse option.

  2. При необходимости задайте для учетной записи организации проверку подлинности и нажмите кнопку "Далее".

    Screenshot of the Connect to data destination menu.

  3. В навигаторе выберите рабочую область, используемую для этого руководства, и разверните ее, чтобы просмотреть все элементы Lakehouse . Выберите SalesLakehouse и убедитесь, что выбрана новая таблица по умолчанию перед нажатием кнопки "Далее".

    Screenshot of the destination target navigator item.

  4. Задайте для метода Update значение "Заменить", а затем нажмите кнопку "Сохранить параметры".

    Внимание

    Установка метода обновления для замены удаляет все существующие данные и заменяет их новыми данными при каждом последующем обновлении.

    Screenshot of the destination settings menu option.

    Примечание.

    В правом нижнем углу редактора Power Query Online можно найти настроенные параметры назначения данных для запроса, где можно дополнительно настроить или удалить.

    Screenshot of the configured data destination.

  5. Прежде чем перейти к следующему разделу этого руководства, обязательно выполните те же действия , что и в предыдущем разделе, чтобы настроить Lakehouse в качестве назначения данных для каждого из следующих запросов.

    Query
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Выберите запрос FactOnlineSales в группе запросов преобразования данных и на вкладке "Главная", выберите "Добавить назначение данных" и выберите параметр Lakehouse.

    Screenshot of the Data destination Lakehouse target option.

  7. При необходимости задайте для учетной записи организации проверку подлинности и нажмите кнопку "Далее".

    Screenshot of the Connect to data destination menu.

  8. В навигаторе выберите рабочую область, используемую для этого руководства, и разверните ее, чтобы просмотреть все элементы Lakehouse . Выберите SalesLakehouse и убедитесь, что выбрана новая таблица по умолчанию перед нажатием кнопки "Далее".

    Screenshot of the destination target navigator window.

  9. Задайте для метода Update значение "Добавить", а затем нажмите кнопку "Сохранить параметры".

    Примечание.

    Этот процесс вставляет данные, сохраняя существующие строки в таблице при каждом последующем обновлении.

    Screenshot of the destination settings menu selection.

  10. Выберите "Опубликовать" , чтобы сохранить поток данных и выйти из редактора Power Query Online .

    Screenshot of the publish button within Power Query Online.

  11. Наведите указатель мыши над созданным потоком данных в рабочей области, выберите многоточие (...) и параметр "Свойства ".

    Screenshot of the dataflows properties in a workspace.

  12. Измените имя потока данных на OnlineSalesDataflow и нажмите кнопку "Сохранить".

    Screenshot of renaming a dataflow option.

Оркестрация конвейера данных

Используя конвейеры, мы сначала оркестрируем обновление потока данных. Если возникает ошибка, мы отправим настроенную электронную почту Outlook, содержащую важные сведения.

  1. Выберите элемент Lakehouse с именем SalesLakehouse в рабочей области.

    Screenshot of renaming an existing dataflow.

  2. Когда вы находитесь в редакторе Lakehouse, выберите новый конвейер данных.

    Примечание.

    Вы также можете выбрать " Получить данные " на ленте, а затем создать конвейер данных.

    Screenshot of watermarks in the Lakehouse editor.

  3. Задайте для имени конвейера значение SalesPipeline. Затем выберите Создать.

    Screenshot of the pipeline name menu option.

  4. Закройте помощник копирования данных, нажав кнопку "Отмена". Если вам будет предложено подтвердить выход из окна данных копирования, нажмите кнопку "Да", отмена.

    Screenshot of the copy data assistant menu.

  5. Когда вы находитесь в редакторе конвейера, выберите "Добавить действие конвейера" и выберите "Поток данных".

    Примечание.

    Вы также можете выбрать поток данных на ленте.

    Screenshot of the pipeline watermark canvas and the add activity option.

  6. Выберите действие потока данных в редакторе конвейера и измените его значение Name на OnlineSalesActivity в разделе "Общие".

    Screenshot of the dataflow name value.

  7. Если действие потока данных по-прежнему выбрано, выберите Параметры и выберите OnlineSalesDataflow из списка потоков данных. При необходимости для обновления списка выберите значок "Обновить ".

    Screenshot of the dataflow selection setting.

  8. Перейдите на вкладку "Действия" , а затем действие Office365 Outlook .

    Примечание.

    Если появится окно предоставления согласия, нажмите кнопку "ОК", войдите с помощью учетной записи организации и нажмите кнопку "Разрешить доступ".

    Screenshot of the Office365 Outlook activity information.

  9. Выберите действие Office365 Outlook в редакторе конвейера и измените его значение Name на Mail при сбое в разделе "Общие".

    Screenshot of the Office365 Outlook activity name.

  10. Если действие Office365 Outlook по-прежнему выбрано, выберите Параметры. Обновите поле To на адрес электронной почты и сбой субъекта конвейера. Выберите динамическое содержимое [ALT+SHIFT+D] для текста почты.

    Примечание.

    Дополнительные параметры конфигурации электронной почты, такие как From (Send as), Cc, Bcc, Метка конфиденциальности и многое другое доступны в дополнительных свойствах.

    Screenshot of the Office365 Outlook settings.

  11. В построителе выражений конвейера вставьте следующий блок кода выражения:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Screenshot of the Office365 Outlook activity with expression builder.

  12. Выберите системные переменные и вставьте следующие переменные , выбрав соответствующее имя из следующей таблицы.

    Имя значения График Системная переменная
    Конвейер. 3 Идентификатор конвейера
    Рабочая область: 6 Идентификатор рабочей области

    Screenshot of the pipeline system variables.

  13. Выберите функции и вставьте следующую функцию, выбрав соответствующее имя из следующей таблицы. После завершения нажмите кнопку "ОК".

    Имя значения График Системная переменная
    Время: 9 utcnow

    Screenshot of pipeline functions.

  14. Выберите OnlineSalesActivity и из доступных параметров пути выберите и удерживайте клавишу "X" (В случае сбоя), чтобы создать стрелку, которая будет удалена на действие "Почта" при сбое. Это действие будет вызываться при сбое OnlineSalesActivity .

    Screenshot of the on failure path.

  15. На вкладке "Главная" выберите "Расписание". После обновления следующих конфигураций нажмите кнопку "Применить ", чтобы сохранить изменения.

    Имя. Значение
    Запланированное выполнение Вкл
    Repeat Ежедневно
    Время 00:00:00

    Screenshot of on failure branch.

  16. На вкладке "Главная" выберите "Выполнить". Если откроется диалоговое окно, выберите параметр "Сохранить и запустить ", чтобы продолжить.

    Screenshot of the run option from the home tab.

    Чтобы отслеживать текущее состояние конвейера, можно просмотреть таблицу выходных данных , которая отображает текущий ход выполнения действия. Таблица периодически обновляется самостоятельно или можно вручную выбрать значок обновления, чтобы обновить его.

    Screenshot of the current pipeline activity progress.

  17. Когда состояние возвращается успешно, вы можете перейти к следующему разделу руководства, вернувшись в рабочую область.

    Screenshot of the side rail with workspace selection.

Создание семантической модели в Lakehouse

Загруженные данные почти готовы для создания отчетов. Сначала будем использовать конечную точку SQL для создания связей и представлений SQL в нашем озерном доме. Это позволяет легко получить доступ к нашим данным в семантической модели, которая представляет собой модель метаданных, содержащую объекты физической базы данных, абстрактные и измененные в логические измерения. Он предназначен для представления данных для анализа в соответствии со структурой бизнеса.

Создание отношений

Эта модель представляет собой схему звездочки, которую можно увидеть из хранилищ данных: она напоминает звезду. Центр звезды — таблица фактов. Окружающие таблицы называются таблицами измерений, которые связаны с таблицей фактов с связями.


  1. В представлении рабочей области выберите элемент конечной точки SQL с именем SalesLakehouse.

    Screenshot of the SQL endpoint item in a workspace.

  2. После Обозреватель выберите представление модели в нижней части экрана, чтобы начать создание связей.

    Screenshot of the Model view selection.

  3. Создайте связь путем перетаскивания столбца CustomerKey из таблицы FactOnlineSales в customerKey в таблице DimCustomer.

  4. После создания связи убедитесь, что выбраны правильные таблицы, столбцы и параметры, как показано в следующей таблице. Нажмите кнопку "Подтвердить" , чтобы продолжить.

    Активировать связь Из: таблица 1 (столбец) To: Table 2 (column) Кратность Направление перекрестной фильтрации
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Многие к одному (*:1) Одна

    Screenshot of Relationship between the FactOnlineSales and DimCustomer table.

  5. Выполните эти же действия для каждой оставшейся таблицы и столбцов, перечисленных в следующей таблице, чтобы создать связи.

    Активировать связь Из: таблица 1 (столбец) To: Table 2 (column) Кратность Направление перекрестной фильтрации
    FactOnlineSales (ProductKey) DimProduct (ProductKey) Многие к одному (*:1) Одна
    FactOnlineSales (StoreKey) DimStore (StoreKey) Многие к одному (*:1) Одна
    FactOnlineSales (DateKey) DimDate (DateKey) Многие к одному (*:1) Одна
    DimStore (StoreKey) DimEmployee (StoreKey) Многие к одному (*:1) Оба

    На следующем рисунке показано готовое представление семантической модели со всеми созданными связями.

    Screenshot of table relationships in the model view pane.

Запись меры в DAX

Давайте напишите базовую меру, которая вычисляет общую сумму продаж.

  1. Выберите таблицу FactOnlineSales в папке "Таблицы ". На вкладке "Главная" выберите "Создать меру".

    Screenshot of table relationships in the model view.

  2. В редакторе формул скопируйте и вставьте или введите следующую меру, чтобы вычислить общую сумму продаж. Выберите проверка метку для фиксации.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Screenshot of Select the check mark to commit a DAX measure.

Создание представления SQL

Давайте напишем инструкцию SQL, которая вычисляет общую сумму продаж по месяцам. Затем мы сохраните это заявление в виде представления в нашем лейкхаусе. Это позволит нам легко получить общий объем продаж за месяц в будущем.

  1. На вкладке "Главная" выберите новый SQL-запрос.

    Screenshot of New SQL query from the home tab.

  2. В редакторе запросов скопируйте и вставьте или введите приведенный ниже запрос, чтобы вычислить общую сумму продаж по количеству месяцев в порядке убывания. После ввода нажмите кнопку "Выполнить ", чтобы просмотреть результаты.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Screenshot of SQL query editor.

  3. Выделите полный текст запроса и нажмите кнопку "Сохранить как представление".

    Screenshot of Save as view option.

  4. В окне "Сохранить как представление" задайте для имени представления значение TotalSalesByMonth и нажмите кнопку "ОК".

    Screenshot of Save as view window.

  5. В Обозреватель разверните раздел "Представления" и выберите TotalSalesByMonth, чтобы просмотреть результаты в предварительной версии данных.

    Screenshot of Views with the Lakehouse explorer.

    После изучения редактора конечной точки SQL вы можете перейти к следующему разделу руководства, вернувшись в рабочую область.

    Screenshot of the side rail and selection of the workspace.

Автоматическое создание отчета

Теперь, когда вы моделировали данные, пришло время визуализировать и изучить данные с помощью быстрого создания.


  1. В представлении рабочей области наведите указатель мыши над набором данных типа элемента (по умолчанию) и именем SalesLakehouse. Выберите многоточие (...) и выберите автоматический отчет.

    Screenshot of the Autocreate report option with a workspace.

    Отчет автоматически создается для вас и динамически обновляется на основе выбранных столбцов на панели данных .

    • Отображаемый отчет может отличаться от приведенного ниже изображения.

    Screenshot of the finished Auto-create report.

  2. Нажмите кнопку "Сохранить " на ленте, чтобы сохранить копию в текущей рабочей области

    • Чтобы ввести полный интерфейс разработки визуальных элементов, можно выбрать команду "Изменить " на ленте.

    Screenshot of the Save button when visualizing data.

  3. В диалоговом окне "Сохранить отчет" введите "Сводка по продажам" в поле "Введите имя" для поля отчета . Нажмите кнопку "Сохранить после завершения".

    Screenshot of the Save button completing its process when visualizing data.

Дополнительные сведения о быстром создании можно узнать.

Поздравляем с завершением работы с руководством! Если вы создали рабочую область для учебника, ее можно удалить. Кроме того, можно удалить отдельные элементы, созданные во время руководства.

Мы надеемся, что в этом руководстве показано, как пользователи Power BI могут легко предоставлять аналитические сведения о данных на любом уровне масштабирования с помощью Microsoft Fabric.