Udostępnij za pośrednictwem


Używanie języka R w Edytor Power Query

Język R to zaawansowany język programowania używany przez wielu statystyków, analityków danych i analityków danych. Możesz użyć języka R w Edytor Power Query programu Power BI Desktop w celu:

  • Przygotowywanie modeli danych.
  • Tworzenie raportów.
  • Czyścić dane, zaawansowane kształtowanie danych i semantyczne analizy modeli, które obejmują brakujące uzupełnianie danych, przewidywania, klastrowanie i nie tylko.

Instalowanie języka R

Język R można pobrać bezpłatnie z repozytorium CRAN.

Instalowanie myszy

W ramach wymagań wstępnych należy zainstalować bibliotekę mice w środowisku języka R. Bez myszy przykładowy kod skryptu nie działa prawidłowo. Pakiet mice implementuje metodę radzenia sobie z brakującymi danymi.

Aby zainstalować bibliotekę mice:

  1. R.exe Uruchom program, na przykład C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Uruchom polecenie instalacji w wierszu polecenia języka R:

    install.packages('mice') 
    

Używanie skryptu języka R w Edytor Power Query

Aby zademonstrować użycie języka R w Edytor Power Query, w tym przykładzie użyto semantycznego modelu giełdowego zawartego w pliku .csv.

  1. Pobierz plik EuStockMarkets_NA.csv. Pamiętaj, gdzie go zapisać.

  2. Załaduj plik do programu Power BI Desktop. Na karcie Narzędzia główne wybierz pozycję Pobierz dane>Text/CSV.

    Screenshot shows the Get data option where you can select Text/CSV.

  3. Wybierz plik EuStockMarkets_NA.csv, a następnie wybierz pozycję Otwórz. Dane CSV są wyświetlane w oknie dialogowym Plik tekstowy/CSV.

    Screenshot shows the contents of the selected .csv file.

  4. Wybierz pozycję Załaduj , aby załadować dane z pliku. Po załadowaniu danych w programie Power BI Desktop nowa tabela zostanie wyświetlona w okienku Pola .

    Screenshot shows data in the Fields pane.

  5. Aby otworzyć Edytor Power Query, na wstążce Narzędzia główne wybierz pozycję Przekształć dane.

    Screenshot shows the Home ribbon with Transform data highlighted.

  6. Na karcie Przekształć wybierz pozycję Uruchom skrypt języka R. Zostanie wyświetlony edytor skryptów Uruchom język R. W wierszach 15 i 20 brakuje danych, podobnie jak w przypadku innych wierszy, których nie widać na obrazie. W poniższych krokach pokazano, jak język R wykonuje te wiersze.

    [Screenshot shows Power Query Editor with Run R Script selected.

  7. W tym przykładzie wprowadź następujący kod skryptu w polu Skrypt okna Uruchom skrypt języka R.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Uwaga

    Może być konieczne zastąpienie zmiennej o nazwie output , aby prawidłowo utworzyć nowy model semantyczny z zastosowanymi filtrami.

  8. Wybierz przycisk OK. Edytor Power Query wyświetla ostrzeżenie dotyczące prywatności danych.

    Screenshot shows data privacy warning with a Continue option.

  9. W komunikacie ostrzegawczym wybierz pozycję Kontynuuj. W wyświetlonym oknie dialogowym Poziomy prywatności ustaw wszystkie źródła danych na Publiczne, aby skrypty języka R działały prawidłowo w usługa Power BI.

    Screenshot shows the Privacy levels dialog with Public privacy selected.

    Aby uzyskać więcej informacji na temat ustawień prywatności i ich skutków, zobacz Poziomy prywatności programu Power BI Desktop.

  10. Wybierz pozycję Zapisz , aby uruchomić skrypt.

    Po uruchomieniu skryptu zobaczysz następujący wynik:

    Screenshot of results of R script.

    Po wybraniu pozycji Tabela obok pozycji Dane wyjściowe w wyświetlonej tabeli zostanie wyświetlona tabela, jak pokazano na poniższej ilustracji.

    Screenshot of table results from R script.

    Zwróć uwagę na nową kolumnę w okienku Pola o nazwie completedValues. W kolumnie Brak wartości SMI brakuje kilku elementów danych. Zobacz, jak język R obsługuje to w następnej sekcji.

    Po zaledwie pięciu wierszach skryptu języka R Edytor Power Query wypełnione brakujące wartości modelem predykcyjnym.

Tworzenie wizualizacji na podstawie danych skryptu języka R

Teraz możemy utworzyć wizualizację, aby zobaczyć, jak kod skryptu języka R z biblioteką mice kończy brakujące wartości.

Screenshot shows an R script visual that includes missing values and completed values.

Wszystkie ukończone wizualizacje można zapisać w jednym pliku pbix programu Power BI Desktop i użyć modelu danych i jego skryptów języka R w usługa Power BI.

Uwaga

Możesz pobrać plik pbix ze wszystkimi wykonanymi krokami.

Po przekazaniu pliku pbix do usługa Power BI należy wykonać inne kroki, aby włączyć odświeżanie danych usługi i zaktualizowane wizualizacje:

  • Włącz zaplanowane odświeżanie dla modelu semantycznego: aby włączyć zaplanowane odświeżanie skoroszytu zawierającego model semantyczny za pomocą skryptów języka R, zobacz Konfigurowanie zaplanowanego odświeżania. Ten artykuł zawiera również informacje o lokalnych bramach danych.

  • Instalowanie bramy: potrzebujesz lokalnej bramy danych (tryb osobisty) zainstalowanej na maszynie, na której znajduje się plik i język R. Usługa Power BI uzyskuje dostęp do tego skoroszytu i ponownie renderuje wszystkie zaktualizowane wizualizacje. Aby uzyskać więcej informacji, zobacz Używanie bram osobistych w usłudze Power BI.

Rozważania i ograniczenia

Istnieją pewne ograniczenia dotyczące zapytań, które obejmują skrypty języka R utworzone w Edytor Power Query:

  • Wszystkie ustawienia źródła danych języka R muszą być ustawione na publiczne. Wszystkie inne kroki zapytania Edytor Power Query muszą być również publiczne.

    Aby uzyskać dostęp do ustawień źródła danych, w programie Power BI Desktop wybierz pozycję Opcje pliku>i ustawienia Ustawienia> źródła danych.

    Screenshot shows the Options and Settings dialog where you can select Data source settings.

    W oknie dialogowym Ustawienia źródła danych wybierz co najmniej jedno źródło danych, a następnie wybierz pozycję Edytuj uprawnienia. Ustaw poziom prywatności na Publiczny.

    Screenshot shows Data source settings dialog where you can edit permissions.

  • Aby zaplanować odświeżanie wizualizacji języka R lub modelu semantycznego, włącz zaplanowane odświeżanie i zainstaluj lokalną bramę danych (tryb osobisty) na komputerze zawierającym skoroszyt i język R. Nie można użyć bramy przedsiębiorstwa do odświeżania modeli semantycznych zawierających skrypty języka R w dodatku Power Query.

Istnieją różne rodzaje rzeczy, które można wykonać za pomocą języka R i zapytań niestandardowych. Eksploruj i kształtuj dane tak, jak chcesz je wyświetlać.