Получение данных из файлов

Завершено

Организации часто экспортируют данные в файлы и хранят в них данные.  Один из возможных форматов файлов — неструктурированный файл. В неструктурированном файле есть только одна таблицу данных, и все строки данных имеют одинаковую структуру. Файл не содержит иерархии.  Вероятно, вы знакомы с наиболее распространенными типами неструктурированных файлов. Это могут быть файлы с разделителями-запятыми (CSV), текстовые файлы с разделителями (TXT) и текстовые файлы с полями фиксированного размера. Другой тип файлов представляют выходные файлы из разных приложений, такие как книги Microsoft Excel (XLSX).

Снимок экрана: значки получения данных из неструктурированных файлов

Power BI Desktop позволяет получать данные из многих типов файлов. Список доступных вариантов вы можете получить, воспользовавшись компонентом Получить данные в Power BI Desktop.  В следующих разделах объясняется, как можно импортировать данные из файла Excel, который хранится на локальном компьютере.

Сценарий

Сотрудники отдела кадров компании Tailwind Traders подготовили неструктурированный файл, содержащий определенные данные о сотрудниках вашей организации, такие как имя, дата приема на работу, должность и руководитель сотрудника.  Они попросили вас создать отчеты Power BI на основе этих данных и данных, находящихся в нескольких других источниках.

Расположение неструктурированных файлов

В первую очередь вам необходимо определить расположение, которое будет использоваться для экспорта и хранения ваших данных.

Ваши файлы Excel могут находиться в одном из следующих расположений.

  • Локальное хранилище. Вы можете импортировать данные из локального файла в Power BI. Сам файл не перемещается в Power BI, и ссылка на него не сохраняется. Вместо этого в Power BI создается новая семантическая модель, и в нее загружаются данные из файла Excel. Соответственно, изменения в исходном файле Excel не отражаются в вашей семантической модели Power BI. Вы можете использовать импорт локальных данных для тех данных, которые не изменяются.

  • OneDrive для бизнеса. Вы можете извлекать данные из OneDrive для бизнеса в Power BI. Этот метод эффективен для синхронизации файла Excel и семантической модели, отчетов и панелей мониторинга в Power BI. Power BI регулярно подключается к вашему файлу в OneDrive. При обнаружении каких-либо изменений семантическая модель, отчеты и панели мониторинга автоматически обновляются в Power BI.

  • OneDrive — персональный. Вы можете использовать данные из файлов в личной учетной записи OneDrive и получать многие из тех преимуществ, которые предоставляет OneDrive для бизнеса. Однако вам необходимо войти в систему со своей личной учетной записью OneDrive и установить флажок Оставаться в системе. Узнайте у системного администратора, разрешен ли такой тип подключения в вашей организации.

  • SharePoint — сайты рабочих групп. Сохранение файлов Power BI Desktop на сайтах рабочих групп SharePoint аналогично сохранению в OneDrive для бизнеса. Основное отличие заключается в том, как вы подключаетесь к файлу из Power BI. Вы можете указать URL-адрес или подключиться к корневой папке.

    Снимок экрана: получение данных из файлов, хранящихся локально или в облаке (OneDrive или SharePoint)

Использование облачного варианта, такого как OneDrive или сайты групп SharePoint, является наиболее эффективным способом синхронизации файла и семантической модели, отчетов и панелей мониторинга в Power BI. Однако если данные не изменяются регулярно, рекомендуется сохранять файлы на локальном компьютере.

Подключение к данным в файле

В Power BI на вкладке Главная нажмите Получить данные. В появившемся списке выберите нужный вариант, например Text/CSV или XML. В этом примере вы выберете Excel.

Совет

На вкладке Главная рядом с кнопкой Получить данные имеются кнопки быстрого доступа к источникам данных, например Excel.

Снимок экрана: выбор Excel в раскрывающемся меню получения данных на вкладке ленты

В зависимости от выбранного варианта вам нужно найти и открыть свой источник данных. Может появиться запрос на вход в службу, например в OneDrive, для проверки подлинности вашего запроса. В этом примере вы откроете книгу Excel с данными о сотрудниках , хранящуюся на рабочем столе (помните, что для практики файлы не предоставляются, это гипотетические действия).

Снимок экрана: выбор файла

Выбор данных для импорта

После подключения файла к Power BI Desktop открывается окно Навигатор. В этом окне отображаются данные, доступные в вашем источнике данных (в данном примере в файле Excel). Вы можете выбрать таблицу или сущность для предварительного просмотра содержимого, чтобы загружать в модель Power BI только правильные данные.

Установите флажки для таблиц, которые вы хотите перенести в Power BI. После установки флажков активируются кнопки Загрузить и Преобразовать данные, как показано на следующем рисунке.

Снимок экрана: окно

Теперь можно нажать кнопку Загрузить, чтобы автоматически загрузить данные в модель Power BI, или кнопку Преобразовать данные, чтобы запустить Редактор Power Query, где можно просмотреть и очистить данные перед загрузкой в модель Power BI.

Мы часто рекомендуем преобразовывать данные, но этот процесс будет обсуждаться позже в этом модуле. В этом примере можно выбрать Загрузить.

Изменение исходного файла

Вам может потребоваться изменить расположение исходного файла для источника данных, например во время разработки или при изменении расположения хранилища файлов.  Чтобы ваши отчеты оставались актуальными, нужно будет обновить пути подключения к файлам в Power BI.

Power Query предоставляет множество способов выполнения этой задачи, чтобы при необходимости можно было вносить изменения этого типа.

  1. Параметры источника данных
  2. Параметры запроса
  3. Расширенный редактор

Предупреждение

Если вы изменяете путь к файлу, убедитесь, что подключаетесь к тому же файлу с той же файловой структурой. Любые структурные изменения в файле, такие как удаление или переименование столбцов, нарушат модель отчета.

Например, попробуйте изменить путь к файлу источника данных в параметрах источника данных. Выберите Параметры источника данных в Power Query. В окне Параметры источника данных выберите свой файл, а затем нажмите Изменить источник. Обновите Путь к файлу или воспользуйтесь параметром Обзор, чтобы найти файл, нажмите кнопку ОК, а затем нажмите кнопку Закрыть.

Снимок экрана: окно