Oktatóanyag: RevoScaleR R-függvények használata SQL Server-adatokkal

A következőkre vonatkozik: SQL Server 2016 (13.x) és újabb verziók

Ebben a többrészes oktatóanyag-sorozatban számos RevoScaleR-függvényt mutatunk be az adatelemzéshez kapcsolódó feladatokhoz. A folyamat során megtudhatja, hogyan hozhat létre távoli számítási környezetet, hogyan helyezhet át adatokat a helyi és távoli számítási környezetek között, és hogyan hajthat végre R-kódot egy távoli SQL Serveren. Azt is megtudhatja, hogyan elemezheti és ábrázolhatja az adatokat helyileg és a távoli kiszolgálón, valamint hogyan hozhat létre és helyezhet üzembe modelleket.

A RevoScaleR egy Microsoft R-csomag, amely elosztott és párhuzamos feldolgozást biztosít az adatelemzési és gépi tanulási számítási feladatokhoz. Az SQL Server R-fejlesztéséhez a RevoScaleR az egyik alapvető beépített csomag, amely az adatforrás-objektumok létrehozására, a számítási környezet beállítására, a csomagok kezelésére és ami a legfontosabb: az adatok végpontok közötti használatával, az importálástól a vizualizációig és az elemzésig. Az SQL Server Machine Learning-algoritmusai függenek a RevoScaleR adatforrásaitól. Tekintettel a RevoScaleR fontosságára, elengedhetetlen tudás tudni, mikor és hogyan hívhatja meg a függvényeit.

Előfeltételek

A helyi és távoli számítási környezetek közötti váltáshoz két rendszerre van szükség. A helyi általában egy olyan fejlesztői munkaállomás, amely elegendő teljesítményű az adatelemzési számítási feladatokhoz. Ebben az esetben az SQL Server a távoli, amelyen engedélyezve van az R funkció.

A számítási környezetek közötti váltás arra van előrevetítve, hogy az azonos verziójú RevoScaleR helyi és távoli rendszereken is elérhető legyen. Egy helyi munkaállomáson a RevoScaleR-csomagokat és a kapcsolódó szolgáltatókat a Microsoft R-ügyfél telepítésével szerezheti be.

Ha az ügyfelet és a kiszolgálót ugyanarra a számítógépre kell helyeznie, telepítsen egy második Microsoft R-kódtárat, amely R-szkriptet küld egy "távoli" ügyfélről. Ne használja az SQL Server-példány programfájljaiban telepített R-kódtárakat. Ha egy számítógépet használ, mindkét helyen szüksége van a RevoScaleR kódtárra az ügyfél- és kiszolgálóműveletek támogatásához.

  • C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
  • C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR

Az ügyfélkonfigurációval kapcsolatos utasításokért lásd: Adatelemzési ügyfél beállítása az R-fejlesztéshez.

R fejlesztői eszközök

Az R-fejlesztők általában fejlesztői környezeteket használnak az R-kód írásához és hibakereséséhez. Íme néhány javaslat:

  • Az R Tools for Visual Studio (RTVS) egy ingyenes beépülő modul, amely Intellisense-t, hibakeresést és támogatást nyújt a Microsoft R-hez. Használhatja az SQL Server Machine Learning Services szolgáltatással. Letöltés: R Tools for Visual Studio.

  • Az RStudio az R-fejlesztés egyik népszerűbb környezete. További információ: RStudio.

  • Az alapszintű R-eszközök (R.exe, RTerm.exe, RScripts.exe) is alapértelmezés szerint telepítve vannak, amikor az R-t az SQL Serverben vagy az R-ügyfélben telepíti. Ha nem szeretne IDE-t telepíteni, a beépített R-eszközökkel végrehajthatja a kódot ebben az oktatóanyagban.

Ne feledje, hogy a RevoScaleR helyi és távoli számítógépeken is szükséges. Ezt az oktatóanyagot nem lehet elvégezni az RStudio általános telepítésével vagy más olyan környezettel, amelyből hiányoznak a Microsoft R-kódtárak. További információ: Adatelemzési ügyfél beállítása.

Tevékenységek összegzése

  • Az adatok kezdetben CSV-fájlokból vagy XDF-fájlokból származnak. Az adatokat az SQL Serverbe importálja a RevoScaleR-csomagban található függvényekkel.
  • A modell betanítása és pontozása az SQL Server számítási környezetével történik.
  • A RevoScaleR függvényekkel új SQL Server-táblákat hozhat létre a pontozási eredmények mentéséhez.
  • Hozzon létre diagramokat a kiszolgálón és a helyi számítási környezetben is.
  • Modell betanítása olyan adatokon, amelyek az SQL Server-adatbázisban találhatók, miközben R futtatása történik az SQL Server-példányban.
  • Kinyerheti az adatok egy részhalmazát, és XDF-fájlként mentheti őket, hogy újra felhasználhassa a helyi munkaállomás elemzésében.
  • Új adatok lekérése a pontozáshoz egy ODBC-kapcsolat megnyitásával az SQL Server-adatbázishoz. A pontozás a helyi munkaállomáson történik.
  • Hozzon létre egy egyéni R-függvényt, és futtassa a kiszolgáló számítási környezetében szimuláció végrehajtásához.

Következő lépések