Язык R — это мощный язык программирования, который используют многие статистические специалисты, специалисты по обработке и анализу данных. Для этого можно использовать R в редакторе Power BI Desktop Power Query:
Подготовка моделей данных.
Создание отчетов.
Выполняйте очистку данных, расширенную обработку данных и анализ семантических моделей, включая восстановление отсутствующих данных, прогнозирование, кластеризацию и многое другое.
Необходимо установить библиотеку mice в вашей среде R. Без мышей пример кода скрипта не работает должным образом. Пакет MICE реализует метод для обработки отсутствующих данных.
Чтобы установить библиотеку мышей, выполните следующие действия.
Запустите программу R.exe, например C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.
Выполните команду установки из командной строки R:
install.packages('mice')
Использование скрипта R в редакторе Power Query
Чтобы продемонстрировать использование R в редакторе Power Query, в этом примере используется семантическая модель фондового рынка, содержащаяся в файле .csv.
Скачайтефайл EuStockMarkets_NA.csv. Помните, где вы сохраните его.
Загрузите файл в Power BI Desktop. На вкладке Главная выберите Получить данные>Текст/CSV.
Выберите файл EuStockMarkets_NA.csv, а затем выберите Открыть. Данные CSV отображаются в диалоговом окне текстового/CSV файла.
Выберите загрузить, чтобы загрузить данные из файла. После загрузки данных Power BI Desktop новая таблица появится в области поля.
Чтобы открыть редактор Power Query, на ленте Главная выберите Преобразование данных.
На вкладке Преобразование выберите Выполнить R-скрипт. Появится редактор скрипта R . В строках 15 и 20 отсутствуют данные, как и другие строки, которые не отображаются на изображении. Следующие шаги демонстрируют, как R завершает эти строки для вас.
В этом примере введите следующий код скрипта в поле Скрипт в окне запуска скрипта R.
Возможно, потребуется перезаписать переменную с именем output, чтобы правильно создать новую семантическую модель с примененными фильтрами.
Нажмите кнопку ОК. Редактор Power Query отображает предупреждение о конфиденциальности данных.
В предупреждающем сообщении выберите "Продолжить". В появившемся диалоговом окне уровней конфиденциальности установите для всех источников данных уровень Общедоступный, чтобы скрипты R корректно работали в службе Power BI.
При запуске скрипта вы увидите следующий результат:
При выборе таблицы рядом с выходными данными в появившейся таблице отображается таблица, как показано на следующем рисунке.
Обратите внимание на новый столбец в области полей с именем completedValues. Столбец отсутствующих значений SMI содержит несколько отсутствующих элементов данных. Ознакомьтесь с тем, как R обрабатывает это в следующем разделе.
Имея всего пять строк скрипта R, редактор Power Query заполнил отсутствующие значения с помощью прогностической модели.
Создание визуальных элементов из данных скрипта R
Теперь мы можем создать визуализацию, чтобы увидеть, как код скрипта R с библиотекой `mice` завершает отсутствующие значения.
Вы можете сохранить все завершенные визуальные элементы в одном PBIX-файле Power BI Desktop и использовать модель данных и его скрипты R в службе Power BI.
После загрузки файла .pbix в службу Power BI необходимо выполнить дополнительные шаги для обновления данных службы и обновления визуальных элементов.
Включить запланированное обновление для семантической модели. Чтобы включить запланированное обновление для книги, содержащей семантическую модель с помощью скриптов R, см. Настройка запланированного обновления. В этой статье также содержатся сведения о локальных шлюзах данных.
Установка шлюза: На компьютере, где находятся файл и R, должен быть установлен локальный шлюз данных (личный режим). Служба Power BI обращается к этой книге и повторно отрисовывает все обновленные визуальные элементы. Дополнительные сведения см. в статье использование личных шлюзов в Power BI.
Рекомендации и ограничения
Существуют некоторые ограничения для запросов, включающих скрипты R, созданные в редакторе Power Query:
Все параметры источника данных R должны иметь значение public. Все остальные шаги в запросе редактора Power Query также должны быть общедоступными.
Чтобы перейти к параметрам источника данных, в Power BI Desktop выберите Файл>Параметры и настройки>Настройки источника данных.
В диалоговом окне параметры источника данных выберите один или несколько источников данных, а затем выберите Изменить разрешения. Установите уровень конфиденциальности на публичный.
Чтобы запланировать обновление визуальных элементов R или семантической модели, включите запланированное обновление и установите локальный шлюз данных (личный режим) на компьютере, содержающем книгу и R. Вы не можете использовать корпоративный шлюз для обновления семантических моделей, содержащих скрипты R в Power Query.
Связанное содержимое
Есть все виды действий, которые можно сделать с помощью R и пользовательских запросов. Просматривайте и формируйте данные так же, как вы хотите, чтобы они отображались.
Демонстрация методов и рекомендаций, которые соответствуют бизнес-и техническим требованиям для моделирования, визуализации и анализа данных с помощью Microsoft Power BI.