Megosztás a következőn keresztül:


revoscalepy (Python-csomag az SQL Server Machine Learning Servicesben)

A következőkre vonatkozik: SQL Server 2017 (14.x) és újabb verziók

A revoscalepy egy Python-csomag a Microsofttól, amely támogatja az elosztott számítástechnikát, a távoli számítási környezeteket és a nagy teljesítményű adatelemzési algoritmusokat. A csomag az SQL Server Machine Learning Services részét képezi.

A csomag a következő funkciókat kínálja:

  • Helyi és távoli számítási környezetek a revoscalepy azonos verziójával rendelkező rendszereken
  • Adatátalakítási és vizualizációs függvények
  • Elosztott vagy párhuzamos feldolgozással skálázható adatelemzési függvények
  • Jobb teljesítmény, beleértve az Intel matematikai kódtárak használatát

A revoscalepy-ban létrehozott adatforrások és számítási környezetek gépi tanulási algoritmusokban is használhatók. Ezeknek az algoritmusoknak a bemutatása: microsoftml Python modul az SQL Serverben.

Teljes referenciadokumentáció

A revoscalepy csomag több Microsoft-termékben van elosztva, de a használat ugyanaz, akár az SQL Serverben, akár egy másik termékben kapja meg a csomagot. Mivel a függvények megegyeznek, az egyes revoscalepy-függvények dokumentációja csak egy helyen jelenik meg a Python-referencia alatt. Ha léteznek termékspecifikus viselkedések, az eltéréseket a függvény súgóoldalán fogjuk feljegyezni.

Verziók és platformok

A revoscalepy modul a Python 3.5-ös verzióján alapul, és csak az alábbi Microsoft-termékek vagy letöltések egyikének telepítésekor érhető el:

Megjegyzés:

A teljes termékkiadású verziók kizárólag Windows verzióban elérhetők az SQL Server 2017-ben. A SQL Server 2019 és újabb verziók támogatják a revoscalepy-t Windows és Linux operációs rendszeren.

Függvények kategória szerint

Ez a rész kategóriák szerint sorolja fel a függvényeket, hogy képet kapj arról, hogyan használják mindegyiket. A tartalomjegyzékben betűrendben is kereshet függvényeket.

1–Adatforrás és számítás

A revoscalepy függvényeket tartalmaz az adatforrások létrehozásához és a számítások helyének vagy számítási környezetének beállításához. Az SQL Server-forgatókönyvekhez kapcsolódó függvények az alábbi táblázatban találhatók.

Az SQL Server és a Python bizonyos esetekben különböző adattípusokat használ. Az SQL és a Python-adattípusok közötti leképezések listáját a Python–SQL adattípusokban találja.

Funkció Description
RxInSqlServer Hozzon létre egy SQL Server számítási környezet objektumot a számítások távoli példányba való leküldéséhez. Számos revoscalepy-függvény argumentumként veszi figyelembe a számítási környezetet. Környezetváltási példa: Modell létrehozása revoscalepy használatával.
RxSqlServerData Sql Server-lekérdezés vagy -tábla alapján hozzon létre egy adatobjektumot.
RxOdbcData Hozzon létre egy adatforrást ODBC-kapcsolat alapján.
RxXdfData Hozzon létre egy adatforrást egy helyi XDF-fájl alapján. Az XDF-fájlokat gyakran használják a memóriabeli adatok lemezre való kiszervezésére. Az XDF-fájlok akkor lehetnek hasznosak, ha több adattal dolgoznak, mint amennyit egy kötegben át lehet vinni az adatbázisból, vagy több adattal, mint amennyi elfér a memóriában. Ha például rendszeresen nagy mennyiségű adatot helyez át egy adatbázisból egy helyi munkaállomásra, ahelyett, hogy minden R-művelethez többször lekérdezi az adatbázist, az XDF-fájlt gyorsítótárként használhatja az adatok helyi mentéséhez, majd az R-munkaterületen való használatához.

Jótanács

Ha még nem ismerkedik az adatforrásokkal vagy számítási környezetekkel, javasoljuk, hogy kezdje az Elosztott számítástechnika című cikkel.

2-Adatkezelés (ETL)

Funkció Description
rx_import Adatok importálása .xdf fájlba vagy adatkeretbe.
rx_data_step Adatok átalakítása bemeneti adatkészletből kimeneti adatkészletté.

3–Betanítás és összegzés

Funkció Description
rx_btrees Sztochasztikus gradiens felerősítéses döntési fák alkalmazása
rx_dforest Besorolási és regressziós döntési erdők igazítása
rx_dtree Besorolási és regressziós fák igazítása
rx_lin_mod Lineáris regressziós modell létrehozása
rx_logit Logisztikai regressziós modell létrehozása
rx_summary A revoscalepy objektumainak egyvariátumos összegzését hozza létre.

További megközelítésekért tekintse át a microsoftml függvényeit is.

4 pontozási függvények

Funkció Description
rx_predict Előrejelzéseket hozhat létre egy betanított modellből, és valós idejű pontozáshoz használható.
rx_predict_default Előrejelzett értékek és reziduálisok kiszámítása rx_lin_mod és rx_logit objektumok használatával.
rx_predict_rx_dforest Egy rx_dforest vagy rx_btrees objektumból származó adatkészlet előrejelzett vagy beépített értékeinek kiszámítása.
rx_predict_rx_dtree Előrejelzett vagy illesztett értékek kiszámítása egy rx_dtree objektumból származó adatkészlethez.

A revoscalepy használatának módja

A revoscalepy függvényei a tárolt eljárásokba ágyazott Python-kódban hívhatók meg. A fejlesztők többsége helyileg hoz létre újraskálázási megoldásokat, majd üzembe helyezési gyakorlatként migrálja a kész Python-kódot a tárolt eljárásokba.

Helyi futtatáskor a Python-szkripteket általában a parancssorban vagy egy Python fejlesztői környezetben futtatják, és az egyik revoscalepy függvénnyel adnak meg egy SQL Server számítási környezetet. A távoli számítási környezetet a teljes kódhoz vagy az egyes függvényekhez használhatja. Előfordulhat például, hogy ki szeretné kapcsolni a modell betanítását a kiszolgálóra, hogy a legújabb adatokat használja, és elkerülje az adatáthelyezést.

Ha készen áll a Python-szkriptek beágyazására egy tárolt eljárásba, sp_execute_external_script javasoljuk, hogy a kódot egyetlen olyan függvényként írja át, amely egyértelműen definiált bemenetekkel és kimenetekkel rendelkezik.

A bemeneteknek és kimeneteknek pandas-adatkereteknek kell lenniük . Ha ez megtörtént, meghívhatja a tárolt eljárást bármely olyan ügyféltől, amely támogatja a T-SQL-t, könnyedén továbbíthat SQL-lekérdezéseket bemenetként, és az eredményeket SQL-táblákba mentheti. Például lásd: Tudjon meg többet a Python-adatelemzésről az SQL-fejlesztők számára.

Revoscalepy használata a microsoftml használatával

A Microsoftml Python-függvényei integrálva vannak a revoscalepy-ban biztosított számítási környezetekkel és adatforrásokkal. Ha függvényeket hív meg a microsoftml-ből, például egy modell definiálásakor és betanításakor, a revoscalepy függvényekkel helyben vagy SQL Server távoli számítási környezetben hajthatja végre a Python-kódot.

Az alábbi példa a modulok Python-kódban való importálásának szintaxisát mutatja be. Ezután hivatkozhat a szükséges egyes függvényekre.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Lásd még