Руководство по Lakehouse. Создание lakehouse, прием примеров данных и создание отчета
В этом руководстве вы создадите lakehouse, введите примеры данных в разностную таблицу, примените преобразование, где это необходимо, а затем создадите отчеты.
Необходимые компоненты
- Создание рабочей области Fabric
- В этой статье описано, как принять CSV-файл, который требует настройки OneDrive. Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.
Создание озера данных
В служба Power BI выберите рабочие области в меню слева.
Чтобы открыть рабочую область, введите его имя в текстовое поле поиска, расположенное в верхней части и выберите его из результатов поиска.
В переключателе интерфейса, расположенном в левом нижнем углу, выберите Инжиниринг данных.
На вкладке Инжиниринг данных выберите Lakehouse, чтобы создать озеро.
В диалоговом окне New lakehouse введите wwilakehouse в поле "Имя".
Выберите "Создать", чтобы создать и открыть новый lakehouse.
Принятие демонстрационных данных
Примечание.
Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.
Скачайте файл dimension_customer.csv из репозитория примеров Fabric.
В обозревателе Lakehouse вы увидите варианты загрузки данных в Lakehouse. Выберите новый поток данных 2-го поколения.
В новой области потока данных выберите "Импорт" из текстового или CSV-файла.
На панели источников данных Подключение нажмите переключатель "Отправить файл". Перетащите файл dimension_customer.csv, скачанный на шаге 1. После отправки файла нажмите кнопку "Далее".
На странице данных предварительного просмотра просмотрите данные и выберите "Создать", чтобы продолжить и вернуться на холст потока данных.
В области параметров запроса обновите поле "Имя" до dimension_customer.
Примечание.
Структура добавляет пробел и число в конце имени таблицы по умолчанию. Имена таблиц должны быть нижним регистром и не должны содержать пробелы. Переименуйте его соответствующим образом и удалите все пробелы из имени таблицы.
В этом руководстве вы уже связали данные клиента с lakehouse. Если у вас есть другие элементы данных, которые необходимо связать с Lakehouse, можно добавить их следующим образом:
В меню выберите "Добавить назначение данных" и выберите Lakehouse. На экране назначения данных Подключение войдите в учетную запись при необходимости и нажмите кнопку "Далее".
Перейдите к wwilakehouse в рабочей области.
Если таблица dimension_customer не существует, выберите параметр "Создать таблицу" и введите имя таблицы dimension_customer. Если таблица уже существует, выберите параметр существующей таблицы и выберите dimension_customer из списка таблиц в обозревателе объектов. Выберите Далее.
На панели "Выбор параметров назначения" выберите "Заменить как метод обновления". Выберите "Сохранить параметры", чтобы вернуться на холст потока данных.
На холсте потока данных можно легко преобразовать данные на основе бизнес-требований. Для простоты мы не делаем никаких изменений в этом руководстве. Чтобы продолжить, выберите "Опубликовать " в правом нижнем углу экрана.
Круг вращения рядом с именем потока данных указывает, что публикация выполняется в представлении элемента. После завершения публикации выберите ... и выберите "Свойства". Переименуйте поток данных в load Lakehouse Table и нажмите кнопку "Сохранить".
Выберите параметр "Обновить сейчас" рядом с именем потока данных, чтобы обновить поток данных. Он запускает поток данных и перемещает данные из исходного файла в таблицу Lakehouse. Пока он выполняется, в представлении элемента отображается круг спиннинга под обновленным столбцом.
После обновления потока данных выберите новый lakehouse на левой панели навигации, чтобы просмотреть таблицу dimension_customer разностной таблицы.
Выберите таблицу для предварительного просмотра данных. Вы также можете использовать конечную точку аналитики SQL в lakehouse для запроса данных с помощью инструкций SQL. Выберите конечную точку аналитики SQL в раскрывающемся меню Lakehouse в правом верхнем углу экрана.
Выберите таблицу dimension_customer , чтобы просмотреть данные или выбрать новый SQL-запрос для записи инструкций SQL.
Следующий пример запроса объединяет количество строк на основе столбца BuyingGroup таблицы dimension_customer. Файлы SQL-запросов сохраняются автоматически для будущей ссылки, и вы можете переименовать или удалить эти файлы в зависимости от необходимости.
Чтобы запустить скрипт, щелкните значок запуска в верхней части файла скрипта.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Создание отчета
Ранее все таблицы и представления lakehouse были автоматически добавлены в семантику модели. При последних обновлениях для новых озерных домов необходимо вручную добавить таблицы в семантику модели. На вкладке "Отчеты Lakehouse" выберите "Управление семантической моделью по умолчанию" и выберите таблицы, которые необходимо добавить в семантику модели. В этом случае выберите таблицу dimension_customer .
Чтобы обеспечить синхронизацию таблиц в семантической модели, перейдите в представление конечной точки аналитики SQL и откройте панель параметров lakehouse. Выберите параметр семантической модели Power BI по умолчанию и включите синхронизацию семантической модели Power BI по умолчанию. Дополнительные сведения см. в разделе "Семантические модели Power BI по умолчанию"
После добавления таблицы создается семантическая модель с тем же именем, что и lakehouse.
В области семантической модели можно просмотреть все таблицы. Вы можете создавать отчеты с нуля, отчета с разбивкой на страницы или автоматически создавать отчет power BI на основе данных. В этом руководстве в разделе "Изучение этих данных" выберите "Автоматически создать отчет". В следующем руководстве мы создадим отчет с нуля.
Так как таблица является измерением и в ней отсутствуют меры, Power BI создает меру для подсчета строк и агрегирует ее по разным столбцам и создает различные диаграммы, как показано на следующем рисунке. Этот отчет можно сохранить в будущем, нажав кнопку "Сохранить " на верхней ленте. Вы можете внести дополнительные изменения в этот отчет в соответствии с вашим требованием, включив или исключив другие таблицы или столбцы.
Следующий шаг
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по