Używanie języka R w Edytor Power Query
Język R to zaawansowany język programowania używany przez wielu statystyków, analityków danych i analityków danych. Możesz użyć języka R w Edytor Power Query programu Power BI Desktop w celu:
- Przygotowywanie modeli danych.
- Tworzenie raportów.
- Czyścić dane, zaawansowane kształtowanie danych i semantyczne analizy modeli, które obejmują brakujące uzupełnianie danych, przewidywania, klastrowanie i nie tylko.
Instalowanie języka R
Język R można pobrać bezpłatnie z repozytorium CRAN.
Instalowanie myszy
W ramach wymagań wstępnych należy zainstalować bibliotekę mice w środowisku języka R. Bez myszy przykładowy kod skryptu nie działa prawidłowo. Pakiet mice implementuje metodę radzenia sobie z brakującymi danymi.
Aby zainstalować bibliotekę mice:
R.exe
Uruchom program, na przykładC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Uruchom polecenie instalacji w wierszu polecenia języka R:
install.packages('mice')
Używanie skryptu języka R w Edytor Power Query
Aby zademonstrować użycie języka R w Edytor Power Query, w tym przykładzie użyto semantycznego modelu giełdowego zawartego w pliku .csv.
Pobierz plik EuStockMarkets_NA.csv. Pamiętaj, gdzie go zapisać.
Załaduj plik do programu Power BI Desktop. Na karcie Narzędzia główne wybierz pozycję Pobierz dane>Text/CSV.
Wybierz plik EuStockMarkets_NA.csv, a następnie wybierz pozycję Otwórz. Dane CSV są wyświetlane w oknie dialogowym Plik tekstowy/CSV.
Wybierz pozycję Załaduj , aby załadować dane z pliku. Po załadowaniu danych w programie Power BI Desktop nowa tabela zostanie wyświetlona w okienku Pola .
Aby otworzyć Edytor Power Query, na wstążce Narzędzia główne wybierz pozycję Przekształć dane.
Na karcie Przekształć wybierz pozycję Uruchom skrypt języka R. Zostanie wyświetlony edytor skryptów Uruchom język R. W wierszach 15 i 20 brakuje danych, podobnie jak w przypadku innych wierszy, których nie widać na obrazie. W poniższych krokach pokazano, jak język R wykonuje te wiersze.
W tym przykładzie wprowadź następujący kod skryptu w polu Skrypt okna Uruchom skrypt języka R.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Uwaga
Może być konieczne zastąpienie zmiennej o nazwie output , aby prawidłowo utworzyć nowy model semantyczny z zastosowanymi filtrami.
Wybierz przycisk OK. Edytor Power Query wyświetla ostrzeżenie dotyczące prywatności danych.
W komunikacie ostrzegawczym wybierz pozycję Kontynuuj. W wyświetlonym oknie dialogowym Poziomy prywatności ustaw wszystkie źródła danych na Publiczne, aby skrypty języka R działały prawidłowo w usługa Power BI.
Aby uzyskać więcej informacji na temat ustawień prywatności i ich skutków, zobacz Poziomy prywatności programu Power BI Desktop.
Wybierz pozycję Zapisz , aby uruchomić skrypt.
Po uruchomieniu skryptu zobaczysz następujący wynik:
Po wybraniu pozycji Tabela obok pozycji Dane wyjściowe w wyświetlonej tabeli zostanie wyświetlona tabela, jak pokazano na poniższej ilustracji.
Zwróć uwagę na nową kolumnę w okienku Pola o nazwie completedValues. W kolumnie Brak wartości SMI brakuje kilku elementów danych. Zobacz, jak język R obsługuje to w następnej sekcji.
Po zaledwie pięciu wierszach skryptu języka R Edytor Power Query wypełnione brakujące wartości modelem predykcyjnym.
Tworzenie wizualizacji na podstawie danych skryptu języka R
Teraz możemy utworzyć wizualizację, aby zobaczyć, jak kod skryptu języka R z biblioteką mice kończy brakujące wartości.
Wszystkie ukończone wizualizacje można zapisać w jednym pliku pbix programu Power BI Desktop i użyć modelu danych i jego skryptów języka R w usługa Power BI.
Uwaga
Możesz pobrać plik pbix ze wszystkimi wykonanymi krokami.
Po przekazaniu pliku pbix do usługa Power BI należy wykonać inne kroki, aby włączyć odświeżanie danych usługi i zaktualizowane wizualizacje:
Włącz zaplanowane odświeżanie dla modelu semantycznego: aby włączyć zaplanowane odświeżanie skoroszytu zawierającego model semantyczny za pomocą skryptów języka R, zobacz Konfigurowanie zaplanowanego odświeżania. Ten artykuł zawiera również informacje o lokalnych bramach danych.
Instalowanie bramy: potrzebujesz lokalnej bramy danych (tryb osobisty) zainstalowanej na maszynie, na której znajduje się plik i język R. Usługa Power BI uzyskuje dostęp do tego skoroszytu i ponownie renderuje wszystkie zaktualizowane wizualizacje. Aby uzyskać więcej informacji, zobacz Używanie bram osobistych w usłudze Power BI.
Rozważania i ograniczenia
Istnieją pewne ograniczenia dotyczące zapytań, które obejmują skrypty języka R utworzone w Edytor Power Query:
Wszystkie ustawienia źródła danych języka R muszą być ustawione na publiczne. Wszystkie inne kroki zapytania Edytor Power Query muszą być również publiczne.
Aby uzyskać dostęp do ustawień źródła danych, w programie Power BI Desktop wybierz pozycję Opcje pliku>i ustawienia Ustawienia> źródła danych.
W oknie dialogowym Ustawienia źródła danych wybierz co najmniej jedno źródło danych, a następnie wybierz pozycję Edytuj uprawnienia. Ustaw poziom prywatności na Publiczny.
Aby zaplanować odświeżanie wizualizacji języka R lub modelu semantycznego, włącz zaplanowane odświeżanie i zainstaluj lokalną bramę danych (tryb osobisty) na komputerze zawierającym skoroszyt i język R. Nie można użyć bramy przedsiębiorstwa do odświeżania modeli semantycznych zawierających skrypty języka R w dodatku Power Query.
Powiązana zawartość
Istnieją różne rodzaje rzeczy, które można wykonać za pomocą języka R i zapytań niestandardowych. Eksploruj i kształtuj dane tak, jak chcesz je wyświetlać.