Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy: SQL Server 2016 (13.x) i nowsze wersje
W tym samouczku dla analityków danych dowiesz się, jak utworzyć kompleksowe rozwiązanie do modelowania predykcyjnego na podstawie obsługi funkcji języka R w programie SQL Server 2016 lub SQL Server 2017. W tym samouczku jest używana baza danych NYCTaxi_sample w programie SQL Server.
Używasz kombinacji kodu języka R, danych programu SQL Server i niestandardowych funkcji SQL, aby utworzyć model klasyfikacji, który wskazuje prawdopodobieństwo, że kierowca może uzyskać poradę dotyczącą konkretnej podróży taksówką. Model języka R jest również wdrażany w programie SQL Server i używasz danych serwera do generowania wyników na podstawie modelu.
Ten przykład można rozszerzyć na wszystkie rodzaje rzeczywistych problemów, takich jak przewidywanie odpowiedzi klientów na kampanie sprzedażowe lub przewidywanie wydatków lub obecności na wydarzeniach. Ponieważ model można wywołać z procedury składowanej, można go łatwo osadzić w aplikacji.
Ponieważ przewodnik został zaprojektowany w celu wprowadzenia deweloperów języka R do usług języka R (In-Database), język R jest używany wszędzie tam, gdzie to możliwe. Nie oznacza to jednak, że język R jest zawsze najlepszym narzędziem dla każdego zadania. W wielu przypadkach program SQL Server może zapewnić lepszą wydajność, szczególnie w przypadku zadań takich jak agregacja danych i inżynieria cech. Takie zadania mogą szczególnie korzystać z nowych funkcji w programie SQL Server, takich jak zoptymalizowane pod kątem pamięci indeksy magazynu kolumn. Staramy się wskazać możliwe optymalizacje po drodze.
Wymagania wstępne
Usługi SQL Server Machine Learning Services z integracją języka R lub usługami SQL Server 2016 R
Uprawnienia bazy danych przyznane użytkownikowi bazy danych przypisane do logowania SQL Server
Środowisko IDE języka R, takie jak RStudio lub wbudowane narzędzie RGUI dołączone do języka R
Zalecamy wykonanie tej instrukcji na komputerze klienckim. Musisz mieć możliwość połączenia się w tej samej sieci z komputerem, na którym włączono SQL Server i język R. Aby uzyskać instrukcje dotyczące konfiguracji stacji roboczej, zobacz Konfigurowanie klienta nauki o danych na potrzeby programowania w języku R.
Alternatywnie można uruchomić przewodnik na komputerze, który ma zarówno program SQL Server, jak i środowisko programistyczne języka R, ale nie zalecamy tej konfiguracji dla środowiska produkcyjnego. Jeśli musisz umieścić klienta i serwer na tym samym komputerze, pamiętaj o zainstalowaniu drugiego zestawu bibliotek języka Microsoft R na potrzeby wysyłania skryptu języka R z klienta "zdalnego". Nie używaj bibliotek języka R zainstalowanych w plikach instalacyjnych wystąpienia SQL Server. W szczególności, jeśli używasz jednego komputera, potrzebujesz biblioteki RevoScaleR w obu tych lokalizacjach do obsługi operacji klienta i serwera.
- C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
- C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR
Dodatkowe pakiety języka R
Ten przewodnik wymaga kilku bibliotek języka R, które nie są instalowane domyślnie w ramach usług języka R (In-Database). Pakiety należy zainstalować zarówno na kliencie, na którym tworzysz rozwiązanie, jak i na komputerze z programem SQL Server, na którym wdrażasz rozwiązanie.
Na stacji roboczej klienta
W środowisku języka R skopiuj następujące wiersze i wykonaj kod w oknie konsoli (Rgui lub IDE). Niektóre pakiety instalują również wymagane pakiety. W sumie instalowanych jest około 32 pakietów. Aby wykonać ten krok, musisz mieć połączenie internetowe.
# Install required R libraries, if they are not already installed.
if (!('ggmap' %in% rownames(installed.packages()))){install.packages('ggmap')}
if (!('mapproj' %in% rownames(installed.packages()))){install.packages('mapproj')}
if (!('ROCR' %in% rownames(installed.packages()))){install.packages('ROCR')}
if (!('RODBC' %in% rownames(installed.packages()))){install.packages('RODBC')}
Na serwerze
Istnieje kilka opcji instalowania pakietów w programie SQL Server. Na przykład program SQL Server udostępnia funkcję zarządzania pakietami języka R , która umożliwia administratorom bazy danych tworzenie repozytorium pakietów i przypisywanie użytkownikowi praw do instalowania własnych pakietów. Jeśli jednak jesteś administratorem na komputerze, możesz zainstalować nowe pakiety przy użyciu języka R, o ile zainstalujesz odpowiednią bibliotekę.
Uwaga / Notatka
Na serwerze nie instaluj biblioteki użytkownika, nawet jeśli zostanie wyświetlony monit. W przypadku instalacji w bibliotece użytkownika, instancja oprogramowania SQL Server nie może odnaleźć ani uruchomić pakietów. Aby uzyskać więcej informacji, zobacz Instalowanie nowych pakietów języka R w programie SQL Server.
Na komputerze z programem SQL Server otwórz RGui.exe jako administrator. Jeśli zainstalowano usługi SQL Server R Przy użyciu ustawień domyślnych, Rgui.exe można znaleźć w katalogu C:\Program Files\Microsoft SQL Server\MSSQL13. MSSQLSERVER\R_SERVICES\bin\x64).
W wierszu polecenia języka R uruchom następujące polecenia języka R:
install.packages("ggmap", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("mapproj", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("ROCR", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("RODBC", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
W tym przykładzie użyto funkcji grep języka R do wyszukania wektora dostępnych ścieżek i znalezienia ścieżki zawierającej "Program Files". Aby uzyskać więcej informacji, zobacz RDocumentation dla pakietu podstawowego.
Jeśli uważasz, że pakiety są już zainstalowane, sprawdź listę zainstalowanych pakietów, uruchamiając polecenie installed.packages().