Руководство. Формирование и объединение данных в Power BI Desktop

С помощью Power BI Desktop вы можете подключаться к различным типам источников данных, а затем формировать данные в соответствии с вашими потребностями, позволяя создавать визуальные отчеты для совместного использования с другими пользователями. Формирование данных означает преобразование данных: переименование столбцов или таблиц, изменение текста на числа, удаление строк, установка первой строки в качестве заголовков и т. д. Объединение данных означает подключение к двум или нескольким источникам данных, формируя их по мере необходимости, а затем консолидируя их в один запрос.

Из этого руководства вы узнаете, как выполнять следующие задачи:

  • Данные фигуры с помощью Редактор Power Query.
  • Подключение в разные источники данных.
  • Объедините эти источники данных и создайте модель данных для использования в отчетах.

В этом руководстве показано, как сформировать запрос с помощью Power BI Desktop, подчеркнув наиболее распространенные задачи. В этом разделе описано более подробное описание запроса, включая создание запроса с нуля в разделе "Начало работы с Power BI Desktop".

Редактор Power Query в Power BI Desktop использует меню правой кнопкой мыши и Преобразование ленты. Большая часть того, что можно выбрать на ленте, также доступна, щелкнув правой кнопкой мыши элемент, например столбец, и выбрав в появившемся меню.

Формирование данных

Чтобы сформировать данные в Редактор Power Query, вы предоставляете пошаговые инструкции для Редактор Power Query для настройки данных по мере загрузки и отображения данных. Исходный источник данных не затрагивается; только это конкретное представление данных настраивается или формируется.

Указанные действия (например, переименование таблицы, преобразование типа данных или удаление столбца) записываются Редактор Power Query. Каждый раз, когда этот запрос подключается к источнику данных, Редактор Power Query выполняет эти действия, чтобы данные всегда формировались таким образом, как вы указали. Этот процесс происходит всякий раз, когда вы используете Редактор Power Query или для тех, кто использует общий запрос, например в служба Power BI. Эти шаги записываются последовательно в области "Запрос Параметры" в разделе "ПРИМЕНЕННЫЕ ШАГИ". Мы рассмотрим каждый из этих шагов, описанных в этой статье.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Импортируйте данные из веб-источника. Выберите раскрывающийся список "Получить данные", а затем выберите "Веб".

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Вставьте этот URL-адрес в диалоговое окно "Из Интернета " и нажмите кнопку "ОК".

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. В диалоговом окне "Навигатор" выберите Table 1пункт "Преобразовать данные".

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Совет

Некоторые сведения в таблицах из предыдущего URL-адреса могут изменяться или обновляться иногда. В результате может потребоваться соответствующим образом настроить выбранные варианты или шаги, описанные в этой статье.

  1. Откроется окно Редактор запросов Power BI. Вы можете просмотреть шаги по умолчанию, примененные до сих пор, в области "Запрос Параметры" в разделе "ПРИМЕНЕННЫЕ ШАГИ".

    • Источник: Подключение на веб-сайт.
    • Извлеченная таблица из Html: выбор таблицы.
    • Продвигаемые заголовки: изменение верхней строки данных в заголовки столбцов.
    • Измененный тип: изменение типов столбцов, импортируемых в виде текста, на их выводимые типы.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Измените имя таблицы по умолчанию Table 1Retirement Dataна , а затем нажмите клавишу ВВОД.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Существующие данные упорядочивается по весовой оценке, как описано на исходной веб-странице в разделе "Методология". Давайте добавим пользовательский столбец, чтобы вычислить другую оценку. Затем мы сортируем таблицу в этом столбце, чтобы сравнить рейтинг пользовательской оценки с существующим рангом.

  4. На ленте "Добавить столбец" выберите "Настраиваемый столбец".

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. В диалоговом окне "Пользовательский столбец" введите "Создать оценку". В формуле настраиваемого столбца введите следующие данные:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Убедитесь, что сообщение о состоянии не обнаружено синтаксической ошибки и нажмите кнопку "ОК".

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. В Параметры запроса список ПРИМЕНЕННЫХ ШАГОВ теперь отображает новый добавленный настраиваемый шаг, который мы только что определили.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Настройка данных

Прежде чем работать с этим запросом, давайте внесите несколько изменений, чтобы изменить свои данные:

  • Измените рейтинг, удалив столбец.

    Например, предположим , что погода не является фактором в наших результатах. Удаление этого столбца из запроса не влияет на другие данные.

  • Исправьте все ошибки.

    Так как мы удалили столбец, нам нужно настроить расчеты в столбце "Новая оценка ", изменив ее формулу.

  • Сортировка данных.

    Сортируйте данные на основе столбца "Новая оценка " и сравнивайте с существующим столбцом ранга .

  • Замените данные.

    Мы рассмотрим, как заменить определенное значение и как вставить примененный шаг.

Эти изменения описаны в следующих шагах.

  1. Чтобы удалить столбец "Погода ", выберите столбец на вкладке "Главная " на ленте и нажмите кнопку " Удалить столбцы".

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Примечание.

    Новые значения оценки не изменились из-за упорядочения шагов. Редактор Power Query записывает шаги последовательно, но независимо друг от друга. Чтобы применить действия в другой последовательности, можно переместить каждый примененный шаг вверх или вниз.

  2. Щелкните правой кнопкой мыши шаг, чтобы просмотреть его контекстное меню.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Перейдите к последнему шагу, удаляя столбцы, до того, как раз выше добавленного настраиваемого шага.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Выберите добавленный пользовательский шаг.

    Обратите внимание, что столбец "Новая оценка " теперь отображает ошибку , а не вычисляемое значение.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Существует несколько способов получить дополнительные сведения о каждой ошибке. Если выбрать ячейку без нажатия слова Error, Редактор Power Query отображает сведения об ошибке.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Если выбрать слово "Ошибка" напрямую, Редактор Power Query создает примененный шаг в области "Запрос Параметры" и отображает сведения об ошибке. Так как нам не нужно отображать сведения об ошибке в другом месте, нажмите кнопку "Отмена".

  5. Чтобы устранить ошибки, необходимо изменить два изменения, удалив имя столбца Погоды и изменив разделитель с 8 до 7. Эти изменения можно внести двумя способами:

    1. Щелкните правой кнопкой мыши шаг "Настраиваемый столбец" и выберите пункт "Изменить Параметры". Откроется диалоговое окно "Настраиваемый столбец" , используемое для создания столбца "Новая оценка ". Измените формулу, как описано ранее, пока она не будет выглядеть следующим образом:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Выберите столбец "Создать оценку", а затем отобразите формулу данных столбца, включив строку формул проверка box на вкладке "Вид".

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Измените формулу, как описано ранее, пока она не будет выглядеть так, а затем нажмите клавишу ВВОД.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Редактор Power Query заменяет данные измененными значениями и Добавленный настраиваемый шаг завершается без ошибок.

    Примечание.

    Вы также можете выбрать команду "Удалить ошибки" с помощью ленты или меню правой кнопкой мыши, которое удаляет все строки с ошибками. Однако в этом руководстве мы хотим сохранить все данные в таблице.

  6. Сортируйте данные на основе столбца "Новая оценка ". Во-первых, выберите последний примененный шаг, добавив custom , чтобы отобразить последние данные. Затем выберите раскрывающийся список рядом с заголовком столбца "Создать оценку " и выберите "Сортировка по убыванию".

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Теперь данные отсортированы в соответствии с новой оценкой. Вы можете выбрать примененный шаг в любом месте списка и продолжить формирование данных в этой последовательности. Редактор Power Query автоматически вставляет новый шаг непосредственно после выбранного в данный момент примененного шага.

  7. В ИНСТРУКЦИИ APPLIED выберите шаг, предшествующий пользовательскому столбцу, который является шагом "Удаленные столбцы ". Здесь мы заменим значение рейтинга стоимости жилья в Орегоне. Щелкните правой кнопкой мыши соответствующую ячейку, содержащую значение стоимости жилья Орегона, а затем выберите "Заменить значения". Обратите внимание, какой примененный шаг в данный момент выбран.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Выберите Вставить.

    Так как мы вставим шаг, Редактор Power Query напоминает нам, что последующие шаги могут привести к разрыву запроса.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Измените значение данных на 100,0.

    Редактор Power Query заменяет данные для Орегона. При создании нового примененного шага Редактор Power Query именуйте его на основе действия, в данном случае замененное значение. Если в запросе есть несколько шагов с одинаковым именем, Редактор Power Query добавляет большее число к имени каждого последующего примененного шага.

  10. Выберите последний примененный шаг, отсортированные строки.

    Обратите внимание, что данные изменились в отношении нового рейтинга Орегона. Это изменение происходит из-за вставки шага "Замененное значение " в правильном расположении перед добавлением настраиваемого шага.

    Теперь мы сформировали наши данные в той степени, в которой мы должны. Затем давайте подключимся к другому источнику данных и объединим данные.

Объединение данных

Данные о различных состояниях интересны и будут полезны для создания дальнейших усилий анализа и запросов. Однако большинство данных о штатах использует двухбуквенное сокращение для кодов состояний, а не полное имя состояния. Нам нужен способ связать имена состояний с их сокращенными именами.

Существует еще один общедоступный источник данных, который обеспечивает эту связь, но он нуждается в справедливом количестве форм, прежде чем мы можем подключить его к нашей пенсионной таблице. Чтобы сформировать данные, выполните следующие действия.

  1. На ленте "Главная" в Редактор Power Query выберите новый исходный > веб-сайт.

  2. Введите адрес веб-сайта для сокращенных состояний, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsа затем выберите Подключение.

    Навигатор отображает содержимое веб-сайта.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Выбор кодов и сокращений для штатов США, федерального округа, территорий и других регионов.

    Совет

    Чтобы проанализировать данные этой таблицы до нужного, потребуется немного. Существует ли более быстрый или простой способ выполнить следующие действия? Да, можно создать связь между двумя таблицами и сформировать данные на основе этой связи. В следующем примере показано, как работать с таблицами. Однако связи помогают быстро использовать данные из нескольких таблиц.

Чтобы получить данные в форму, выполните следующие действия.

  1. Удалите верхнюю строку. Так как это результат создания таблицы веб-страницы, нам не нужно. На ленте "Главная" выберите "Удалить строки>", чтобы удалить верхние строки.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Откроется диалоговое окно "Удалить верхние строки". Укажите 1 строку для удаления.

  2. Продвигайте новую верхнюю строку к заголовкам с использованием заголовков первой строки в качестве заголовков на вкладке "Главная " или на вкладке "Преобразование " на ленте.

  3. Поскольку таблица данных о выходе на пенсию не содержит сведений о Вашингтоне или территориях, нам нужно отфильтровать их из нашего списка. Выберите имя и состояние раскрывающегося списка столбца region_1, а затем снимите все проверка boxes, кроме состояния.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Удалите все ненужные столбцы. Так как нам нужно только сопоставление каждого состояния с официальным двухбуквенный сокращением (имя и состояние столбцов региона и ANSI ), мы можем удалить другие столбцы. Сначала выберите имя и состояние столбца региона , а затем удерживайте клавишу CTRL и выберите столбец ANSI . На вкладке "Главная " на ленте выберите "Удалить столбцы > ", чтобы удалить другие столбцы.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Примечание.

    Последовательность примененных шагов в Редактор Power Query важна и влияет на формирование данных. Также важно рассмотреть, как один шаг может повлиять на другой последующий шаг. Например, если удалить шаг из примененных шагов, последующие шаги могут не вести себя так, как изначально.

    Примечание.

    При изменении размера окна Редактор Power Query, чтобы уменьшить ширину, некоторые элементы ленты будут сокращены, чтобы лучше всего использовать видимое пространство. При увеличении ширины окна Редактор Power Query элементы ленты расширяются, чтобы сделать большую часть увеличенной области ленты.

  5. Переименуйте столбцы и таблицу. Существует несколько способов переименовать столбец: сначала выберите столбец, а затем выберите "Переименовать " на вкладке "Преобразование " на ленте или щелкните правой кнопкой мыши и выберите " Переименовать". На следующем рисунке показаны оба варианта, но вам нужно выбрать только один.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Переименуйте столбцы в имя состояния и код состояния. Чтобы переименовать таблицу, введите коды состояний именв области Параметры запроса.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Объединение запросов

Теперь, когда мы сформировали таблицу кодов состояний так, как мы хотим, давайте объединим эти две таблицы или запросы в одну. Так как теперь таблицы являются результатом запросов, которые мы применили к данным, они часто называются запросами.

Есть два основных способа слияния запросов — объединение и добавление.

  • Для одного или нескольких столбцов , которые вы хотите добавить в другой запрос, вы объединяете запросы.
  • Для одной или нескольких строк данных, которые вы хотите добавить в существующий запрос, добавьте этот запрос.

В этом случае мы хотим объединить запросы:

  1. В левой области Редактор Power Query выберите запрос, в который нужно объединить другой запрос. В этом случае это данные о выходе на пенсию.

  2. Выберите "Запросы > слияния" на вкладке "Главная" на ленте.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Возможно, вам будет предложено задать уровни конфиденциальности, чтобы убедиться, что данные объединяются без включения или передачи данных, которые вы не хотите передать.

    Откроется окно слияния. Он предложит выбрать таблицу, которую вы хотите объединить в выбранную таблицу, и соответствующие столбцы, используемые для слияния.

  3. Выберите состояние из таблицы данных о выходе на пенсию, а затем выберите запрос кодов состояния.

    При выборе соответствующих столбцов кнопка "ОК " включена.

    Screenshot of Power Query Editor's Merge dialog.

  4. Нажмите ОК.

    Редактор Power Query создает новый столбец в конце запроса, который содержит содержимое таблицы (запроса), который был объединен с существующим запросом. Все столбцы из объединенного запроса сложены в столбец, но вы можете развернуть таблицу и включить все нужные столбцы.

  5. Чтобы развернуть объединенную таблицу и выбрать, какие столбцы необходимо включить, выберите значок развертывания ( ).

    Откроется окно Развернуть.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. В этом случае мы хотим только столбец "Код состояния". Выберите этот столбец, снимите имя исходного столбца в качестве префикса, а затем нажмите кнопку "ОК".

    Если мы оставили поле проверка box, выбранное для имени исходного столбца в качестве префикса, объединенный столбец будет называться State Code.State Code.

    Примечание.

    Если вы хотите изучить, как использовать таблицу кодов состояний, можно поэкспериментировать немного. Если вы не любите результаты, просто удалите этот шаг из списка ПРИМЕНЕННЫХ ШАГОВ в области "Запрос Параметры", и запрос возвращается в состояние перед применением этого шага развертывания. Это можно сделать столько раз, сколько вам нравится, пока процесс развертывания не будет выглядеть так, как это нужно.

    Теперь у нас есть один запрос (таблица), который объединяет два источника данных, каждый из которых был сформирован в соответствии с нашими потребностями. Этот запрос может быть основой для интересных подключений к данным, таких как статистика расходов на жилье, качество жизни или уровень преступности в любом штате.

  7. Чтобы применить изменения и закрыть Редактор Power Query, нажмите кнопку "Закрыть" и "Применить" на вкладке "Главная лента".

    Преобразованная семантическая модель отображается в Power BI Desktop, которую можно использовать для создания отчетов.

    Screenshot of Power Query Editor's Close & Apply button.

Дополнительные сведения о Power BI Desktop и его возможностях см. в следующих ресурсах: