Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op: SQL Server 2017 (14.x) en latere versies
revoscalepy is een Python-pakket van Microsoft dat ondersteuning biedt voor gedistribueerde computing, externe rekencontexten en krachtige data science-algoritmen. Het pakket is opgenomen in SQL Server Machine Learning Services.
Het pakket biedt de volgende functionaliteit:
- Lokale en externe compute-contexten op systemen met dezelfde versie van revoscalepy
- Functies voor gegevenstransformatie en visualisatie
- Data science-functies, schaalbaar via gedistribueerde of parallelle verwerking
- Verbeterde prestaties, waaronder het gebruik van de Intel-wiskundebibliotheken
Gegevensbronnen en compute-contexten die u in revoscalepy maakt, kunnen ook worden gebruikt in machine learning-algoritmen. Zie de microsoftml Python-module in SQL Server voor een inleiding tot deze algoritmen.
Volledige referentiedocumentatie
Het revoscalepy-pakket wordt gedistribueerd in meerdere Microsoft-producten, maar het gebruik is hetzelfde, ongeacht of u het pakket in SQL Server of een ander product krijgt. Omdat de functies hetzelfde zijn, wordt documentatie voor afzonderlijke revoscalepy-functies gepubliceerd op slechts één locatie onder de Python-verwijzing. Als er productspecifieke gedragingen bestaan, worden verschillen vermeld op de helppagina van de functie.
Versies en platforms
De revoscalepy-module is gebaseerd op Python 3.5 en is alleen beschikbaar wanneer u een van de volgende Microsoft-producten of -downloads installeert:
Opmerking
Volledige productreleaseversies zijn alleen voor Windows beschikbaar in SQL Server 2017. Windows en Linux worden ondersteund voor revoscalepy in SQL Server 2019 en latere versies.
Functies per categorie
Deze sectie geeft een lijst van de functies per categorie om je een idee te geven van hoe elke functie wordt gebruikt. U kunt de inhoudsopgave ook gebruiken om functies in alfabetische volgorde te vinden.
1-gegevensbron en berekening
revoscalepy bevat functies voor het maken van gegevensbronnen en het instellen van de locatie, of rekencontext, waar berekeningen worden uitgevoerd. Functies die relevant zijn voor SQL Server-scenario's worden vermeld in de onderstaande tabel.
SQL Server en Python gebruiken in sommige gevallen verschillende gegevenstypen. Zie Python-naar-SQL-gegevenstypen voor een lijst met toewijzingen tussen SQL- en Python-gegevenstypen.
| Functie | Description |
|---|---|
| RxInSqlServer | Maak een SQL Server-contextobject om berekeningen naar een extern exemplaar te pushen. Verschillende revoscalepy-functies nemen de rekencontext als argument. Zie Een model maken met behulp van revoscalepy voor een voorbeeld van een contextswitch. |
| RxSqlServerData | Maak een gegevensobject op basis van een SQL Server-query of -tabel. |
| RxOdbcData | Maak een gegevensbron op basis van een ODBC-verbinding. |
| RxXdfData | Maak een gegevensbron op basis van een lokaal XDF-bestand. XDF-bestanden worden vaak gebruikt om in-memory gegevens naar schijf te offloaden. Een XDF-bestand kan handig zijn bij het werken met meer gegevens dan kan worden overgedragen vanuit de database in één batch of meer gegevens dan in het geheugen past. Als u bijvoorbeeld regelmatig grote hoeveelheden gegevens van een database naar een lokaal werkstation verplaatst in plaats van herhaaldelijk een query uit te voeren op de database voor elke R-bewerking, kunt u het XDF-bestand gebruiken als een soort cache om de gegevens lokaal op te slaan en deze vervolgens in uw R-werkruimte te bewerken. |
Aanbeveling
Als u niet bekend bent met het idee van gegevensbronnen of rekencontexten, raden we u aan om te beginnen met het artikel Gedistribueerde computing.
2-Gegevensmanipulatie (ETL)
| Functie | Description |
|---|---|
| rx_import | Gegevens importeren in een .xdf-bestand of -gegevensframe. |
| rx_data_step | Gegevens van een invoergegevensset transformeren naar een uitvoergegevensset. |
3-Training en samenvatting
| Functie | Description |
|---|---|
| rx_btrees | Fit stochastische kleurovergang versterkte beslissingsstructuren |
| rx_dforest | Pas classificatie- en regressiebeslissingsbossen aan |
| rx_dtree | Classificatie- en regressiestructuren aanpassen |
| rx_lin_mod | Een lineair regressiemodel maken |
| rx_logit | Een logistiek regressiemodel maken |
| rx_summary | Maak univariate samenvattingen van objecten in revoscalepy. |
Bekijk ook de functies in Microsoftml voor aanvullende benaderingen.
4-Scorefuncties
| Functie | Description |
|---|---|
| rx_predict | Genereer voorspellingen van een getraind model en kan worden gebruikt voor realtime scoren. |
| rx_predict_default | Bereken voorspelde waarden en residuen met behulp van rx_lin_mod- en rx_logit-objecten. |
| rx_predict_rx_dforest | Bereken voorspelde of aangepaste waarden voor een gegevensset van een rx_dforest of rx_btrees object. |
| rx_predict_rx_dtree | Bereken voorspelde of aangepaste waarden voor een gegevensset van een rx_dtree-object. |
Hoe te werken met revoscalepy
Functies in revoscalepy kunnen worden aangeroepen in Python-code die is ingekapseld in opgeslagen procedures. De meeste ontwikkelaars bouwen lokaal hervoscalepy-oplossingen en migreren vervolgens voltooide Python-code naar opgeslagen procedures als implementatieoefening.
Wanneer u lokaal uitvoert, voert u doorgaans een Python-script uit vanaf de opdrachtregel of vanuit een Python-ontwikkelomgeving en geeft u een SQL Server-rekencontext op met behulp van een van de revoscalepy-functies . U kunt de externe rekencontext gebruiken voor de volledige code of voor afzonderlijke functies. U kunt bijvoorbeeld modeltraining offloaden naar de server om de meest recente gegevens te gebruiken en gegevensverplaatsing te voorkomen.
Wanneer u klaar bent om python-scripts in een opgeslagen procedure in te kapselen, sp_execute_external_script, wordt u aangeraden de code opnieuw te schrijven als één functie met duidelijk gedefinieerde invoer en uitvoer.
Invoer en uitvoer moeten pandas-dataframes zijn. Wanneer dit gebeurt, kunt u de opgeslagen procedure aanroepen vanaf elke client die T-SQL ondersteunt, eenvoudig SQL-query's doorgeven als invoer en de resultaten opslaan in SQL-tabellen. Zie voor een voorbeeld Learn in-database Python-analyses voor SQL-ontwikkelaars.
Gebruikmaken van revoscalepy met microsoftml
De Python-functies voor microsoftml zijn geïntegreerd met de rekencontexten en gegevensbronnen die worden geleverd in revoscalepy. Wanneer u functies aanroept van microsoftml, bijvoorbeeld bij het definiëren en trainen van een model, gebruikt u de functie revoscalepy om de Python-code lokaal of in een externe SQL Server-rekencontext uit te voeren.
In het volgende voorbeeld ziet u de syntaxis voor het importeren van modules in uw Python-code. Vervolgens kunt u verwijzen naar de afzonderlijke functies die u nodig hebt.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource