Анализ данных в Azure Data Lake Storage 2-го поколения с помощью Power BI

В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных, хранящихся в учетной записи хранения с иерархическим пространством имен (Azure Data Lake Storage 2-го поколения).

Необходимые компоненты

Для работы с этим учебником необходимо следующее:

  • Подписка Azure. Перейдите на сайт бесплатной пробной версии Azure.
  • Учетная запись хранения с иерархическим пространством имен. Следуйте инструкциям по созданию учетной записи хранения. В этой статье предполагается, что вы создали учетную запись хранения с именем contosoadlscdm.
  • Убедитесь, что для учетной записи хранения предоставлена одна из следующих ролей: средство чтения данных BLOB-объектов, участник данных BLOB-объектов или владелец данных BLOB-объектов.
  • Пример файла данных с именем Drivers.txt , расположенного в учетной записи хранения. Этот пример можно скачать из репозитория Azure Data Lake Git, а затем отправить этот файл в учетную запись хранения.
  • Power BI Desktop. Это приложение можно скачать из Центра загрузки Майкрософт.

Создание отчета в Power BI Desktop

  1. Запустите Power BI Desktop на своем компьютере.

  2. Следуйте инструкциям из статьи соединителя Azure Data Lake Storage 2-го поколения, чтобы подключиться к примеру данных.

  3. В Навигаторе Power Query выберите "Загрузить".

    Screenshot of the Navigator, with data from the Drivers.txt file displayed.

  4. После успешной загрузки данных в Power BI на панели "Поля " отображаются следующие поля.

    Screenshot of the Fields panel, showing Query1, which contains Date accessed, Date created, Date modified, Extension, Folder Path, and Name fields.

    Однако для визуализации и анализа данных может потребоваться, чтобы данные были доступны с помощью следующих полей.

    Screenshot of a data table, with names and addresses from the Content column in the original table displayed in rows.

    В следующих шагах вы обновите запрос, чтобы преобразовать импортированные данные в нужный формат.

  5. На вкладке "Главная " на ленте выберите "Преобразовать данные". Затем откроется редактор Power Query, отображающий содержимое файла.

    Screenshot of the Power Query editor, with the query created from the original Drivers.txt file.

  6. В редакторе Power Query в столбце "Содержимое" выберите "Двоичный". Файл будет автоматически обнаружен как CSV-файл и будет содержать выходные данные, как показано ниже. Данные теперь имеют формат, который можно использовать для создания визуализаций.

    Screenshot of the Power Query editor, showing the data from the Binary field expanded to a table with names and addresses, with Imported CSV and Changed Type added to the Applied Steps panel.

  7. На вкладке "Главная " на ленте нажмите кнопку "Закрыть" и " Применить".

    Closeup screenshot of the Power Query editor, showing the Close & Apply option.

  8. После обновления запроса на вкладке "Поля " отображаются новые поля, доступные для визуализации.

    Screenshot of the Fields pane in Power BI, with Query1 now displaying Column1 through Column8.

  9. Теперь можно создать круговую диаграмму для представления драйверов в каждом городе для определенной страны или региона. Для этого выполним указанные ниже действия.

    На вкладке "Визуализации" выберите символ круговой диаграммы .

    Screenshot of the Visualizations pane, with the pie chart symbol emphasized.

    В этом примере столбцы, которые вы будете использовать, — "Столбец 4" (имя города) и "Столбец 7" (имя страны или региона). Перетащите эти столбцы на вкладку "Поля " на вкладку "Визуализации" , как показано ниже.

    Screenshot with Column4 dragged and dropped in Details and Column7 dragged and dropped in Values in the Visualization pane, and Column7 also dragged and dropped into Filters on this page in the Filters pane.

    Круговая диаграмма должна выглядеть примерно так, как показано ниже.

    Screenshot of pie chart showing the percentages of each slice of the pie, along with color coding of each of the locations, and a column containing all locations and their color code on the right side.

  10. Если выбрать определенную страну или регион из фильтров уровня страницы, отобразится количество драйверов в каждом городе выбранной страны или региона. Например, на вкладке Визуализации в списке Фильтры уровня страницы выберите Бразилия.

    Screenshot of the Filters on this page pane, with Brazil selected as the country/region to display.

  11. Круговая диаграмма автоматически обновится, и вы увидите количество водителей в городах Бразилии.

    Screenshot of pie chart with the percentages of each slice of the pie for locations in Brazil, along with a list of all locations in Brazil and their color code in a column on the right side.

  12. В меню "Файл" выберите "Сохранить", чтобы сохранить визуализацию в виде файла Power BI Desktop.

Публикация отчета в службе Power BI

После создания визуализаций в Power BI Desktop вы можете поделиться ими с другими пользователями, публикуя их в служба Power BI. Инструкции по этой настройке см. в статье "Публикация из Power BI Desktop".

См. также