Использование R в Редактор Power Query
Язык R — это мощный язык программирования, который используют многие статистические специалисты, специалисты по обработке и анализу данных. Для этого можно использовать R в Редактор Power Query Power BI Desktop:
- Подготовка моделей данных.
- Создание отчетов.
- Очистка данных, расширенная обработка данных и семантическая аналитика моделей, включая отсутствие завершения данных, прогнозирование, кластеризация и многое другое.
Установка R
Вы можете скачать R бесплатно из репозитория CRAN.
Установка мышей
В качестве необходимого условия необходимо установить библиотеку мышей в среде R. Без мышей пример кода скрипта не работает должным образом. Пакет мышей реализует метод для борьбы с отсутствующими данными.
Чтобы установить библиотеку мышей, выполните следующие действия.
R.exe
Запустите программу, напримерC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Выполните команду установки из командной строки R:
install.packages('mice')
Использование скрипта R в Редактор Power Query
Чтобы продемонстрировать использование R в Редактор Power Query, в этом примере используется семантическая модель фондового рынка, содержащаяся в файле .csv.
Скачайте файл EuStockMarkets_NA.csv. Помните, где вы сохраните его.
Загрузите файл в Power BI Desktop. На вкладке "Главная" выберите "Получить текст данных>" или "CSV".
Выберите файл EuStockMarkets_NA.csv и нажмите кнопку "Открыть". Данные CSV отображаются в диалоговом окне "Текстовый /CSV-файл ".
Выберите "Загрузить" , чтобы загрузить данные из файла. После загрузки данных в Power BI Desktop новая таблица появится на панели "Поля ".
Чтобы открыть Редактор Power Query, на ленте "Главная" выберите "Преобразовать данные".
На вкладке "Преобразование" выберите "Запустить скрипт R". Откроется редактор скрипта Run R. В строках 15 и 20 отсутствуют данные, как и другие строки, которые не отображаются на изображении. Ниже показано, как R завершает эти строки.
В этом примере введите следующий код скрипта в поле "Скрипт" окна скрипта запуска R.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Примечание.
Возможно, потребуется перезаписать переменную с именем выходных данных , чтобы правильно создать новую семантику модели с примененными фильтрами.
Нажмите ОК. Редактор Power Query отображает предупреждение о конфиденциальности данных.
В сообщении с предупреждением нажмите кнопку "Продолжить". В появившемся диалоговом окне "Уровни конфиденциальности" задайте для всех источников данных общедоступный для сценариев R правильно работать в служба Power BI.
Дополнительные сведения о параметрах конфиденциальности и их последствиях см. в разделе "Уровни конфиденциальности Power BI Desktop".
Нажмите кнопку "Сохранить", чтобы запустить скрипт.
При запуске скрипта вы увидите следующий результат:
При выборе таблицы рядом с выводом в появившемся таблице отображается таблица, как показано на следующем рисунке.
Обратите внимание, что новый столбец в области "Поля " называется completedValues. Столбец отсутствующих значений SMI содержит несколько отсутствующих элементов данных. Ознакомьтесь с тем, как R обрабатывает это в следующем разделе.
Всего пять строк скрипта R Редактор Power Query заполнены отсутствующими значениями с прогнозной моделью.
Создание визуальных элементов из данных скрипта R
Теперь мы можем создать визуальный элемент, чтобы узнать, как код скрипта R с библиотекой мышей завершает отсутствующие значения.
Вы можете сохранить все завершенные визуальные элементы в одном PBIX-файле Power BI Desktop и использовать модель данных и его скрипты R в служба Power BI.
Примечание.
Вы можете скачать PBIX-файл со всеми этими шагами.
После отправки PBIX-файла в служба Power BI необходимо выполнить другие действия, чтобы включить обновление и обновленные визуальные элементы службы:
Включение запланированного обновления для семантической модели. Чтобы включить запланированное обновление для книги, содержащей семантику модели с помощью скриптов R, см . статью "Настройка запланированного обновления". В этой статье также содержатся сведения о локальных шлюзах данных.
Установите шлюз: на компьютере, где находится файл и R, необходимо установить локальный шлюз данных (личный режим). Служба Power BI обращается к этой книге и повторно отрисовывает все обновленные визуальные элементы. Дополнительные сведения см. в статье об использовании личных шлюзов в Power BI.
Рекомендации и ограничения
Существуют некоторые ограничения для запросов, включающих скрипты R, созданные в Редактор Power Query:
Все параметры источника данных R должны иметь значение Public. Все остальные шаги в запросе Редактор Power Query также должны быть общедоступными.
Чтобы добраться до параметров источника данных, в Power BI Desktop выберите >параметры файла и параметры> источника данных.
В диалоговом окне "Параметры источника данных" выберите один или несколько источников данных и выберите пункт "Изменить разрешения". Задайте уровень конфиденциальности общедоступным.
Чтобы запланировать обновление визуальных элементов R или семантической модели, включите запланированное обновление и установите локальный шлюз данных (личный режим) на компьютере, содержающем книгу и R. Вы не можете использовать корпоративный шлюз для обновления семантических моделей, содержащих скрипты R в Power Query.
Связанный контент
Есть все виды действий, которые можно сделать с помощью R и пользовательских запросов. Просматривайте и формируйте данные так же, как вы хотите, чтобы они отображались.