Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik: SQL Server 2017 (14.x) és újabb verziók
A revoscalepy egy Python-csomag a Microsofttól, amely támogatja az elosztott számítástechnikát, a távoli számítási környezeteket és a nagy teljesítményű adatelemzési algoritmusokat. A csomag az SQL Server Machine Learning Services részét képezi.
A csomag a következő funkciókat kínálja:
- Helyi és távoli számítási környezetek a revoscalepy azonos verziójával rendelkező rendszereken
- Adatátalakítási és vizualizációs függvények
- Elosztott vagy párhuzamos feldolgozással skálázható adatelemzési függvények
- Jobb teljesítmény, beleértve az Intel matematikai kódtárak használatát
A revoscalepy-ban létrehozott adatforrások és számítási környezetek gépi tanulási algoritmusokban is használhatók. Ezeknek az algoritmusoknak a bemutatása: microsoftml Python modul az SQL Serverben.
Teljes referenciadokumentáció
A revoscalepy csomag több Microsoft-termékben van elosztva, de a használat ugyanaz, akár az SQL Serverben, akár egy másik termékben kapja meg a csomagot. Mivel a függvények megegyeznek, az egyes revoscalepy-függvények dokumentációja csak egy helyen jelenik meg a Python-referencia alatt. Ha léteznek termékspecifikus viselkedések, az eltéréseket a függvény súgóoldalán fogjuk feljegyezni.
Verziók és platformok
A revoscalepy modul a Python 3.5-ös verzióján alapul, és csak az alábbi Microsoft-termékek vagy letöltések egyikének telepítésekor érhető el:
Megjegyzés:
A teljes termékkiadású verziók kizárólag Windows verzióban elérhetők az SQL Server 2017-ben. A SQL Server 2019 és újabb verziók támogatják a revoscalepy-t Windows és Linux operációs rendszeren.
Függvények kategória szerint
Ez a rész kategóriák szerint sorolja fel a függvényeket, hogy képet kapj arról, hogyan használják mindegyiket. A tartalomjegyzékben betűrendben is kereshet függvényeket.
1–Adatforrás és számítás
A revoscalepy függvényeket tartalmaz az adatforrások létrehozásához és a számítások helyének vagy számítási környezetének beállításához. Az SQL Server-forgatókönyvekhez kapcsolódó függvények az alábbi táblázatban találhatók.
Az SQL Server és a Python bizonyos esetekben különböző adattípusokat használ. Az SQL és a Python-adattípusok közötti leképezések listáját a Python–SQL adattípusokban találja.
| Funkció | Description |
|---|---|
| RxInSqlServer | Hozzon létre egy SQL Server számítási környezet objektumot a számítások távoli példányba való leküldéséhez. Számos revoscalepy-függvény argumentumként veszi figyelembe a számítási környezetet. Környezetváltási példa: Modell létrehozása revoscalepy használatával. |
| RxSqlServerData | Sql Server-lekérdezés vagy -tábla alapján hozzon létre egy adatobjektumot. |
| RxOdbcData | Hozzon létre egy adatforrást ODBC-kapcsolat alapján. |
| RxXdfData | Hozzon létre egy adatforrást egy helyi XDF-fájl alapján. Az XDF-fájlokat gyakran használják a memóriabeli adatok lemezre való kiszervezésére. Az XDF-fájlok akkor lehetnek hasznosak, ha több adattal dolgoznak, mint amennyit egy kötegben át lehet vinni az adatbázisból, vagy több adattal, mint amennyi elfér a memóriában. Ha például rendszeresen nagy mennyiségű adatot helyez át egy adatbázisból egy helyi munkaállomásra, ahelyett, hogy minden R-művelethez többször lekérdezi az adatbázist, az XDF-fájlt gyorsítótárként használhatja az adatok helyi mentéséhez, majd az R-munkaterületen való használatához. |
Jótanács
Ha még nem ismerkedik az adatforrásokkal vagy számítási környezetekkel, javasoljuk, hogy kezdje az Elosztott számítástechnika című cikkel.
2-Adatkezelés (ETL)
| Funkció | Description |
|---|---|
| rx_import | Adatok importálása .xdf fájlba vagy adatkeretbe. |
| rx_data_step | Adatok átalakítása bemeneti adatkészletből kimeneti adatkészletté. |
3–Betanítás és összegzés
| Funkció | Description |
|---|---|
| rx_btrees | Sztochasztikus gradiens felerősítéses döntési fák alkalmazása |
| rx_dforest | Besorolási és regressziós döntési erdők igazítása |
| rx_dtree | Besorolási és regressziós fák igazítása |
| rx_lin_mod | Lineáris regressziós modell létrehozása |
| rx_logit | Logisztikai regressziós modell létrehozása |
| rx_summary | A revoscalepy objektumainak egyvariátumos összegzését hozza létre. |
További megközelítésekért tekintse át a microsoftml függvényeit is.
4 pontozási függvények
| Funkció | Description |
|---|---|
| rx_predict | Előrejelzéseket hozhat létre egy betanított modellből, és valós idejű pontozáshoz használható. |
| rx_predict_default | Előrejelzett értékek és reziduálisok kiszámítása rx_lin_mod és rx_logit objektumok használatával. |
| rx_predict_rx_dforest | Egy rx_dforest vagy rx_btrees objektumból származó adatkészlet előrejelzett vagy beépített értékeinek kiszámítása. |
| rx_predict_rx_dtree | Előrejelzett vagy illesztett értékek kiszámítása egy rx_dtree objektumból származó adatkészlethez. |
A revoscalepy használatának módja
A revoscalepy függvényei a tárolt eljárásokba ágyazott Python-kódban hívhatók meg. A fejlesztők többsége helyileg hoz létre újraskálázási megoldásokat, majd üzembe helyezési gyakorlatként migrálja a kész Python-kódot a tárolt eljárásokba.
Helyi futtatáskor a Python-szkripteket általában a parancssorban vagy egy Python fejlesztői környezetben futtatják, és az egyik revoscalepy függvénnyel adnak meg egy SQL Server számítási környezetet. A távoli számítási környezetet a teljes kódhoz vagy az egyes függvényekhez használhatja. Előfordulhat például, hogy ki szeretné kapcsolni a modell betanítását a kiszolgálóra, hogy a legújabb adatokat használja, és elkerülje az adatáthelyezést.
Ha készen áll a Python-szkriptek beágyazására egy tárolt eljárásba, sp_execute_external_script javasoljuk, hogy a kódot egyetlen olyan függvényként írja át, amely egyértelműen definiált bemenetekkel és kimenetekkel rendelkezik.
A bemeneteknek és kimeneteknek pandas-adatkereteknek kell lenniük . Ha ez megtörtént, meghívhatja a tárolt eljárást bármely olyan ügyféltől, amely támogatja a T-SQL-t, könnyedén továbbíthat SQL-lekérdezéseket bemenetként, és az eredményeket SQL-táblákba mentheti. Például lásd: Tudjon meg többet a Python-adatelemzésről az SQL-fejlesztők számára.
Revoscalepy használata a microsoftml használatával
A Microsoftml Python-függvényei integrálva vannak a revoscalepy-ban biztosított számítási környezetekkel és adatforrásokkal. Ha függvényeket hív meg a microsoftml-ből, például egy modell definiálásakor és betanításakor, a revoscalepy függvényekkel helyben vagy SQL Server távoli számítási környezetben hajthatja végre a Python-kódot.
Az alábbi példa a modulok Python-kódban való importálásának szintaxisát mutatja be. Ezután hivatkozhat a szükséges egyes függvényekre.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource