Анализ данных в Azure Data Lake Storage 1-го поколения с помощью Power BI
В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных в Azure Data Lake Storage 1-го поколения.
Предварительные требования
Перед началом работы с этим учебником необходимо иметь следующее:
- Подписка Azure. См. страницу бесплатной пробной версии Azure.
- Учетная запись Data Lake Storage 1-го поколения. Следуйте инструкциям из статьи Начало работы с Azure Data Lake Storage Gen1 с помощью портала Azure. В этой статье предполагается, что вы уже создали учетную запись Data Lake Storage 1-го поколения с именем myadlsg1 и добавили в нее образец файла данных (Drivers.txt). Этот образец файла можно скачать в репозитории Git для озера данных Azure.
- Power BI Desktop. Это средство можно скачать в Центре загрузки Майкрософт.
Создание отчета в Power BI Desktop
Запустите Power BI Desktop на своем компьютере.
На ленте Главная нажмите кнопку Получить данные, а затем щелкните "Дополнительно". В диалоговом окне Получение данных выберите пункт Azure, а затем выберите пункт Azure Data Lake Store и нажмите кнопку Подключиться.
Если появится диалоговое окно с сообщением о том, что соединитель находится в стадии разработки, выберите вариант "Продолжить".
В диалоговом окне Azure Data Lake Store укажите URL-адрес для своей учетной записи Data Lake Storage 1-го поколения и нажмите кнопку ОК.
В следующем диалоговом окне нажмите кнопку Вход, чтобы войти в учетную запись Data Lake Storage 1-го поколения. Вы будете перенаправлены на страницу входа своей организации. Следуйте инструкциям для входа в учетную запись.
Успешно выполнив вход, нажмите кнопку Подключиться.
В следующем диалоговом окне будет указан файл, который вы добавили в учетную запись Data Lake Storage 1-го поколения. Проверьте информацию и нажмите кнопку Загрузить.
После успешной загрузки данных в Power BI вы увидите приведенные ниже поля на вкладке Поля .
Однако для визуализации и анализа данных мы рекомендуем использовать показанные ниже поля.
В следующих шагах мы обновим запрос, чтобы преобразовать импортированные данные в нужный формат.
На вкладке Главная ленты нажмите кнопку Изменить запросы.
В редакторе запросов в столбце Содержимое выберите вариант Двоичные данные.
Вы увидите значок, представляющий добавленный вами файл Drivers.txt . Щелкните файл правой кнопкой мыши и выберите пункт CSV.
В результате вы увидите выходные данные, приведенные ниже. Данные теперь имеют формат, который можно использовать для создания визуализаций.
На вкладке Главная ленты нажмите кнопку Закрыть и применить и выберите пункт Закрыть и применить.
После обновления запроса на вкладке Поля появятся новые поля, доступные для визуализации.
Создадим круговую диаграмму, на которой будет представлено количество водителей в каждом городе данной страны или региона. Для этого выполним указанные ниже действия.
На вкладке "Визуализации" щелкните символ круговой диаграммы.
Мы собираемся использовать следующие столбцы: Столбец 4 (название города) и Столбец 7 (название страны или региона). Перетащите их с вкладки Поля на вкладку Визуализации, как показано ниже.
Круговая диаграмма теперь должна выглядеть так, как показано ниже.
Выбрав определенную страну или регион в фильтрах уровня страницы, вы можете увидеть количество водителей в каждом городе этой страны или региона. Например, на вкладке Визуализации в списке Фильтры уровня страницы выберите Бразилия.
Круговая диаграмма автоматически обновится, и вы увидите количество водителей в городах Бразилии.
В меню Файл выберите пункт Сохранить, чтобы сохранить визуализацию как файл Power BI Desktop.
Публикация отчета в службе Power BI
Создав визуализации в Power BI Desktop, вы можете предоставить общий доступ к ним другим пользователям, опубликовав их в службе Power BI. Инструкции см. в разделе Публикация из Power BI Desktop.