Прочитать на английском

Поделиться через


Использование R в Редактор Power Query

Язык R — это мощный язык программирования, который используют многие статистические специалисты, специалисты по обработке и анализу данных. Для этого можно использовать R в Редактор Power Query Power BI Desktop:

  • Подготовка моделей данных.
  • Создание отчетов.
  • Очистка данных, расширенная обработка данных и семантическая аналитика моделей, включая отсутствие завершения данных, прогнозирование, кластеризация и многое другое.

Установка R

Вы можете скачать R бесплатно из репозитория CRAN.

Установка мышей

В качестве необходимого условия необходимо установить библиотеку мышей в среде R. Без мышей пример кода скрипта не работает должным образом. Пакет мышей реализует метод для борьбы с отсутствующими данными.

Чтобы установить библиотеку мышей, выполните следующие действия.

  1. R.exe Запустите программу, напримерC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Выполните команду установки из командной строки R:

    R
    install.packages('mice') 
    

Использование скрипта R в Редактор Power Query

Чтобы продемонстрировать использование R в Редактор Power Query, в этом примере используется семантическая модель фондового рынка, содержащаяся в файле .csv.

  1. Скачайте файл EuStockMarkets_NA.csv. Помните, где вы сохраните его.

  2. Загрузите файл в Power BI Desktop. На вкладке "Главная" выберите "Получить текст данных>" или "CSV".

    Screenshot shows the Get data option where you can select Text/CSV.

  3. Выберите файл EuStockMarkets_NA.csv и нажмите кнопку "Открыть". Данные CSV отображаются в диалоговом окне "Текстовый /CSV-файл ".

    Screenshot shows the contents of the selected .csv file.

  4. Выберите "Загрузить" , чтобы загрузить данные из файла. После загрузки данных в Power BI Desktop новая таблица появится на панели "Поля ".

    Screenshot shows data in the Fields pane.

  5. Чтобы открыть Редактор Power Query, на ленте "Главная" выберите "Преобразовать данные".

    Screenshot shows the Home ribbon with Transform data highlighted.

  6. На вкладке "Преобразование" выберите "Запустить скрипт R". Откроется редактор скрипта Run R. В строках 15 и 20 отсутствуют данные, как и другие строки, которые не отображаются на изображении. Ниже показано, как R завершает эти строки.

    [Screenshot shows Power Query Editor with Run R Script selected.

  7. В этом примере введите следующий код скрипта в поле "Скрипт" окна скрипта запуска R.

    R
       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Примечание

    Возможно, потребуется перезаписать переменную с именем выходных данных , чтобы правильно создать новую семантику модели с примененными фильтрами.

  8. Нажмите ОК. Редактор Power Query отображает предупреждение о конфиденциальности данных.

    Screenshot shows data privacy warning with a Continue option.

  9. В сообщении с предупреждением нажмите кнопку "Продолжить". В появившемся диалоговом окне "Уровни конфиденциальности" задайте для всех источников данных общедоступный для сценариев R правильно работать в служба Power BI.

    Screenshot shows the Privacy levels dialog with Public privacy selected.

    Дополнительные сведения о параметрах конфиденциальности и их последствиях см. в разделе "Уровни конфиденциальности Power BI Desktop".

  10. Нажмите кнопку "Сохранить", чтобы запустить скрипт.

    При запуске скрипта вы увидите следующий результат:

    Screenshot of results of R script.

    При выборе таблицы рядом с выводом в появившемся таблице отображается таблица, как показано на следующем рисунке.

    Screenshot of table results from R script.

    Обратите внимание, что новый столбец в области "Поля " называется completedValues. Столбец отсутствующих значений SMI содержит несколько отсутствующих элементов данных. Ознакомьтесь с тем, как R обрабатывает это в следующем разделе.

    Всего пять строк скрипта R Редактор Power Query заполнены отсутствующими значениями с прогнозной моделью.

Создание визуальных элементов из данных скрипта R

Теперь мы можем создать визуальный элемент, чтобы узнать, как код скрипта R с библиотекой мышей завершает отсутствующие значения.

Screenshot shows an R script visual that includes missing values and completed values.

Вы можете сохранить все завершенные визуальные элементы в одном PBIX-файле Power BI Desktop и использовать модель данных и его скрипты R в служба Power BI.

Примечание

Вы можете скачать PBIX-файл со всеми этими шагами.

После отправки PBIX-файла в служба Power BI необходимо выполнить другие действия, чтобы включить обновление и обновленные визуальные элементы службы:

  • Включение запланированного обновления для семантической модели. Чтобы включить запланированное обновление для книги, содержащей семантику модели с помощью скриптов R, см . статью "Настройка запланированного обновления". В этой статье также содержатся сведения о локальных шлюзах данных.

  • Установите шлюз: на компьютере, где находится файл и R, необходимо установить локальный шлюз данных (личный режим). Служба Power BI обращается к этой книге и повторно отрисовывает все обновленные визуальные элементы. Дополнительные сведения см. в статье об использовании личных шлюзов в Power BI.

Рекомендации и ограничения

Существуют некоторые ограничения для запросов, включающих скрипты R, созданные в Редактор Power Query:

  • Все параметры источника данных R должны иметь значение Public. Все остальные шаги в запросе Редактор Power Query также должны быть общедоступными.

    Чтобы добраться до параметров источника данных, в Power BI Desktop выберите >параметры файла и параметры> источника данных.

    Screenshot shows the Options and Settings dialog where you can select Data source settings.

    В диалоговом окне "Параметры источника данных" выберите один или несколько источников данных и выберите пункт "Изменить разрешения". Задайте уровень конфиденциальности общедоступным.

    Screenshot shows Data source settings dialog where you can edit permissions.

  • Чтобы запланировать обновление визуальных элементов R или семантической модели, включите запланированное обновление и установите локальный шлюз данных (личный режим) на компьютере, содержающем книгу и R. Вы не можете использовать корпоративный шлюз для обновления семантических моделей, содержащих скрипты R в Power Query.

Есть все виды действий, которые можно сделать с помощью R и пользовательских запросов. Просматривайте и формируйте данные так же, как вы хотите, чтобы они отображались.