Megosztás a következőn keresztül:


Oktatóanyag: SQL-fejlesztés R-adattudósok számára

A következőkre vonatkozik: SQL Server 2016 (13.x) és újabb verziók

Ebben az adatszakértőknek szóló oktatóanyagban megtudhatja, hogyan hozhat létre teljes körű megoldást a prediktív modellezéshez az R-funkciók támogatása alapján az SQL Server 2016-ban vagy az SQL Server 2017-ben. Ez az oktatóanyag egy NYCTaxi_sample adatbázist használ az SQL Serveren.

Az R-kód, a SQL Server-adatok és az egyéni SQL-függvények kombinációjával olyan besorolási modellt hozhat létre, amely jelzi annak valószínűségét, hogy a sofőr tippet kaphat egy adott taxiúthoz. Az R-modellt az SQL Serveren is üzembe helyezheti, és kiszolgálói adatokkal hozhat létre pontszámokat a modell alapján.

Ez a példa kiterjeszthető mindenféle valós problémára, például az értékesítési kampányokra adott ügyfélválaszok előrejelzésére, vagy a kiadások vagy az eseményeken való részvétel előrejelzésére. Mivel a modell meghívható egy tárolt eljárásból, egyszerűen beágyazhatja egy alkalmazásba.

Mivel a bemutató célja az, hogy az R-fejlesztőket bevezesse az R-szolgáltatások (In-Database) használatába, az R-t, ahol csak lehetséges, használjuk. Ez azonban nem jelenti azt, hogy az R feltétlenül a legjobb eszköz minden tevékenységhez. Az SQL Server sok esetben jobb teljesítményt nyújthat, különösen olyan feladatok esetében, mint az adatösszesítés és a szolgáltatásfejlesztés. Az ilyen feladatok különösen hasznosak lehetnek az SQL Server új funkciói, például a memóriaoptimalizált oszlopcentrikus indexek. Az út során igyekszünk rámutatni a lehetséges optimalizálásokra.

Előfeltételek

Javasoljuk, hogy ezt az útmutatót egy kliens munkaállomáson végezze el. Ugyanazon a hálózaton csatlakoznia kell egy SQL Server-számítógéphez, amelyen engedélyezve van az SQL Server és az R nyelv. A munkaállomás konfigurációjára vonatkozó utasításokért lásd: Adatelemzési ügyfél beállítása R-fejlesztéshez.

Másik lehetőségként futtathatja az útmutatót olyan számítógépen, amelyen sql Server és R fejlesztési környezet is található, de éles környezetben nem javasoljuk ezt a konfigurációt. Ha az ügyfelet és a kiszolgálót ugyanarra a számítógépre kell helyeznie, telepítsen egy második Microsoft R-kódtárat, amely R-szkriptet küld egy "távoli" ügyfélről. Ne használja az SQL Server-példány programfájljaiban telepített R-kódtárakat. Ha egy számítógépet használ, mindkét helyen szüksége van a RevoScaleR kódtárra az ügyfél- és kiszolgálóműveletek támogatásához.

  • C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
  • C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR

További R-csomagok

Ehhez az útmutatóhoz több olyan R-kódtárra van szükség, amelyek alapértelmezés szerint nincsenek telepítve az R-szolgáltatások részeként (In-Database). A csomagokat telepítenie kell mind arra az ügyfélre, ahol a megoldást fejleszti, mind arra az SQL Server-számítógépre, amelyen a megoldást üzembe helyezi.

Ügyfél-munkaállomáson

Az R környezetben másolja a következő sorokat, és hajtsa végre a kódot egy konzolablakban (Rgui vagy IDE). Egyes csomagok a szükséges csomagokat is telepítik. Összességében körülbelül 32 csomag van telepítve. A lépés végrehajtásához internetkapcsolattal kell rendelkeznie.

# Install required R libraries, if they are not already installed.
if (!('ggmap' %in% rownames(installed.packages()))){install.packages('ggmap')}
if (!('mapproj' %in% rownames(installed.packages()))){install.packages('mapproj')}
if (!('ROCR' %in% rownames(installed.packages()))){install.packages('ROCR')}
if (!('RODBC' %in% rownames(installed.packages()))){install.packages('RODBC')}

A kiszolgálón

Az SQL Serveren számos lehetőség közül választhat a csomagok telepítésére. Az SQL Server például olyan R-csomagkezelési funkciót biztosít, amellyel az adatbázisgazdák létrehozhatnak egy csomagtárat, és hozzárendelhetik a felhasználót a saját csomagok telepítéséhez szükséges jogosultságokhoz. Ha azonban Ön rendszergazda a számítógépen, telepíthet új csomagokat az R használatával, feltéve, hogy a megfelelő könyvtárba telepíti őket.

Megjegyzés:

A kiszolgálón ne telepítsen felhasználói könyvtárba, még akkor sem, ha erre a rendszer kéri. Ha felhasználói kódtárba telepít, az SQL Server-példány nem találja vagy futtatja a csomagokat. További információ: Új R-csomagok telepítése az SQL Serveren.

  1. Az SQL Server számítógépen nyissa meg a RGui.exe rendszergazdaként. Ha az SQL Server R Servicest az alapértelmezett beállításokkal telepítette, az Rgui.exe a C:\Program Files\Microsoft SQL Server\MSSQL13\MSSQLSERVER\R_SERVICES\bin\x64 található.

  2. Egy R-parancssorban futtassa a következő R-parancsokat:

install.packages("ggmap", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("mapproj", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("ROCR", lib=grep("Program Files", .libPaths(), value=TRUE)[1])
install.packages("RODBC", lib=grep("Program Files", .libPaths(), value=TRUE)[1])

Ez a példa az R grep függvényt használja a rendelkezésre álló elérési utak vektorának keresésére és a "Programfájlok" elérési út megkeresésére. További információért lásd: RDocumentation az alapcsomagról.

Ha úgy gondolja, hogy a csomagok már telepítve vannak, ellenőrizze a telepített csomagok listáját installed.packages() futtatásával.

Következő lépések