Руководство по Lakehouse. Создание lakehouse, прием примеров данных и создание отчета

В этом руководстве вы создадите lakehouse, введите примеры данных в разностную таблицу, примените преобразование, где это необходимо, а затем создадите отчеты.

Необходимые компоненты

Создание озера данных

  1. В служба Power BI выберите рабочие области в меню слева.

  2. Чтобы открыть рабочую область, введите его имя в текстовое поле поиска, расположенное в верхней части и выберите его из результатов поиска.

  3. В переключателе интерфейса, расположенном в левом нижнем углу, выберите Инжиниринг данных.

    Снимок экрана, показывающий, где выбрать переключатель взаимодействия и Инжиниринг данных.

  4. На вкладке Инжиниринг данных выберите Lakehouse, чтобы создать озеро.

  5. В диалоговом окне New lakehouse введите wwilakehouse в поле "Имя".

    Снимок экрана: диалоговое окно New Lakehouse.

  6. Выберите "Создать", чтобы создать и открыть новый lakehouse.

Принятие демонстрационных данных

Примечание.

Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.

  1. Скачайте файл dimension_customer.csv из репозитория примеров Fabric.

  2. В обозревателе Lakehouse вы увидите варианты загрузки данных в Lakehouse. Выберите новый поток данных 2-го поколения.

    Снимок экрана: выбор параметра New Dataflow 2-го поколения для загрузки данных в lakehouse.

  3. В новой области потока данных выберите "Импорт" из текстового или CSV-файла.

  4. На панели источников данных Подключение нажмите переключатель "Отправить файл". Перетащите файл dimension_customer.csv, скачанный на шаге 1. После отправки файла нажмите кнопку "Далее".

    Снимок экрана, показывающий, где выбрать команду

  5. На странице данных предварительного просмотра просмотрите данные и выберите "Создать", чтобы продолжить и вернуться на холст потока данных.

  6. В области параметров запроса обновите поле "Имя" до dimension_customer.

    Примечание.

    Структура добавляет пробел и число в конце имени таблицы по умолчанию. Имена таблиц должны быть нижним регистром и не должны содержать пробелы. Переименуйте его соответствующим образом и удалите все пробелы из имени таблицы.

    Снимок экрана: область параметров запроса, показывающая, где ввести имя и выбрать место назначения данных.

  7. В этом руководстве вы уже связали данные клиента с lakehouse. Если у вас есть другие элементы данных, которые необходимо связать с Lakehouse, можно добавить их следующим образом:

    • В меню выберите "Добавить назначение данных" и выберите Lakehouse. На экране назначения данных Подключение войдите в учетную запись при необходимости и нажмите кнопку "Далее".

    • Перейдите к wwilakehouse в рабочей области.

    • Если таблица dimension_customer не существует, выберите параметр "Создать таблицу" и введите имя таблицы dimension_customer. Если таблица уже существует, выберите параметр существующей таблицы и выберите dimension_customer из списка таблиц в обозревателе объектов. Выберите Далее.

      Снимок экрана: выбор целевой таблицы.

    • На панели "Выбор параметров назначения" выберите "Заменить как метод обновления". Выберите "Сохранить параметры", чтобы вернуться на холст потока данных.

  8. На холсте потока данных можно легко преобразовать данные на основе бизнес-требований. Для простоты мы не делаем никаких изменений в этом руководстве. Чтобы продолжить, выберите "Опубликовать " в правом нижнем углу экрана.

    Снимок экрана: панель параметров запроса, содержащая кнопку

  9. Круг вращения рядом с именем потока данных указывает, что публикация выполняется в представлении элемента. После завершения публикации выберите ... и выберите "Свойства". Переименуйте поток данных в load Lakehouse Table и нажмите кнопку "Сохранить".

  10. Выберите параметр "Обновить сейчас" рядом с именем потока данных, чтобы обновить поток данных. Он запускает поток данных и перемещает данные из исходного файла в таблицу Lakehouse. Пока он выполняется, в представлении элемента отображается круг спиннинга под обновленным столбцом.

    Снимок экрана: расположение значка

  11. После обновления потока данных выберите новый lakehouse на левой панели навигации, чтобы просмотреть таблицу dimension_customer разностной таблицы.

    Снимок экрана: панель навигации, из которой открывается lakehouse.

  12. Выберите таблицу для предварительного просмотра данных. Вы также можете использовать конечную точку аналитики SQL в lakehouse для запроса данных с помощью инструкций SQL. Выберите конечную точку аналитики SQL в раскрывающемся меню Lakehouse в правом верхнем углу экрана.

    Снимок экрана: разностная таблица, показывающая, где выбрать конечную точку аналитики SQL.

  13. Выберите таблицу dimension_customer , чтобы просмотреть данные или выбрать новый SQL-запрос для записи инструкций SQL.

    Снимок экрана: экран конечной точки аналитики SQL, на котором показано, где выбрать новый SQL-запрос.

  14. Следующий пример запроса объединяет количество строк на основе столбца BuyingGroup таблицы dimension_customer. Файлы SQL-запросов сохраняются автоматически для будущей ссылки, и вы можете переименовать или удалить эти файлы в зависимости от необходимости.

    Чтобы запустить скрипт, щелкните значок запуска в верхней части файла скрипта.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Создание отчета

  1. Ранее все таблицы и представления lakehouse были автоматически добавлены в семантику модели. При последних обновлениях для новых озерных домов необходимо вручную добавить таблицы в семантику модели. На вкладке "Отчеты Lakehouse" выберите "Управление семантической моделью по умолчанию" и выберите таблицы, которые необходимо добавить в семантику модели. В этом случае выберите таблицу dimension_customer .

    Снимок экрана: выбор таблиц для добавления в семантику модели.

  2. Чтобы обеспечить синхронизацию таблиц в семантической модели, перейдите в представление конечной точки аналитики SQL и откройте панель параметров lakehouse. Выберите параметр семантической модели Power BI по умолчанию и включите синхронизацию семантической модели Power BI по умолчанию. Дополнительные сведения см. в разделе "Семантические модели Power BI по умолчанию"

    Снимок экрана: включение синхронизации данных с семантической моделью по умолчанию

  3. После добавления таблицы создается семантическая модель с тем же именем, что и lakehouse.

    Снимок экрана: семантическая модель по умолчанию, созданная при создании нового lakehouse.

  4. В области семантической модели можно просмотреть все таблицы. Вы можете создавать отчеты с нуля, отчета с разбивкой на страницы или автоматически создавать отчет power BI на основе данных. В этом руководстве в разделе "Изучение этих данных" выберите "Автоматически создать отчет". В следующем руководстве мы создадим отчет с нуля.

    Снимок экрана: страница сведений о семантической модели, на которой показано, где выбрать команду

  5. Так как таблица является измерением и в ней отсутствуют меры, Power BI создает меру для подсчета строк и агрегирует ее по разным столбцам и создает различные диаграммы, как показано на следующем рисунке. Этот отчет можно сохранить в будущем, нажав кнопку "Сохранить " на верхней ленте. Вы можете внести дополнительные изменения в этот отчет в соответствии с вашим требованием, включив или исключив другие таблицы или столбцы.

    Снимок экрана: страница

Следующий шаг