Delen via


microsoftml (Python-pakket in SQL Server Machine Learning Services)

Van toepassing op: SQL Server 2017 (14.x) en latere versies

microsoftml is een Python-pakket van Microsoft dat hoogwaardige machine learning-algoritmen biedt. Het bevat functies voor training en transformaties, score, tekst- en beeldanalyse, en feature-extractie om waarden af te leiden uit bestaande data. Het pakket is inbegrepen in SQL Server Machine Learning Services en ondersteunt hoge prestaties op big data, met gebruik van multicoreverwerking en snelle datastreaming.

Pakketdetails Information
Huidige versie: 9,4
Gebouwd op: Anaconda 4.2-distributie van Python 3.7.1
Pakketdistributie: SQL Server Machine Learning Services versie 2017 of 2019.

Hoe gebruik je microsoftml

De microsoftml-module wordt geïnstalleerd als onderdeel van SQL Server Machine Learning Services wanneer je Python aan je installatie toevoegt. Je krijgt de volledige verzameling propriëtaire pakketten plus een Python-distributie met modules en interpreters. Je kunt elke Python-IDE gebruiken om Python-scriptaanroepfuncties in microsoftml te schrijven, maar het script moet draaien op een computer met SQL Server Machine Learning Services en Python.

Microsoftml en revoscalepy zijn nauw gekoppeld; Gegevensbronnen die in MicrosoftML worden gebruikt, worden gedefinieerd als Revoscalepy-objecten . Compute contextbeperkingen in revoscalepy worden overgedragen naar microsoftml. Namelijk dat alle functionaliteit beschikbaar is voor lokale bewerkingen, maar overschakelen naar een externe computecontext vereist RxSpark of RxInSQLServer.

Versies en platforms

De microsoftml-module is alleen beschikbaar wanneer je een van de volgende Microsoft-producten installeert of downloadt:

Opmerking

Volledige productreleaseversies zijn alleen voor Windows beschikbaar in SQL Server 2017. Zowel Windows als Linux worden ondersteund voor microsoftml in SQL Server 2019.

Pakketafhankelijkheden

Algoritmen in microsoftml zijn afhankelijk van revoscalepy voor:

  • Databronobjecten - Data die door microsoftml-functies wordt verbruikt, wordt gemaakt met behulp van revoscalepy-functies .
  • Remote computing (het verplaatsen van functie-uitvoering naar een externe SQL Server-instantie) - Het revoscalepy-pakket biedt functies voor het creëren en activeren van een remote compute-context voor SQL Server.

In de meeste gevallen laad je de pakketten samen wanneer je microsoftml gebruikt.

Functies per categorie

Deze sectie geeft een lijst van de functies per categorie om je een idee te geven van hoe elke functie wordt gebruikt. Je kunt ook de inhoudsopgave gebruiken om functies alfabetisch te vinden.

1-Trainingsfuncties

Functie Description
microsoftml.rx_ensemble Train een ensemble van modellen.
microsoftml.rx_fast_forest Willekeurig bos.
microsoftml.rx_fast_linear Lineair model. met stochastische duale coördinatenopgang.
microsoftml.rx_fast_trees Gebooste bomen.
microsoftml.rx_logistic_regression Logistieke regressie.
microsoftml.rx_neural_network Neuraal netwerk.
microsoftml.rx_oneclass_svm Anomaliedetectie.

2-transformatiefuncties

Categorische variabelenbehandeling

Functie Description
microsoftml.categorical Zet een tekstkolom om in categorieën.
microsoftml.categorical_hash Hasht en zet een tekstkolom om in categorieën.

Schemamanipulatie

Functie Description
MicrosoftML.concat Voegt meerdere kolommen samen tot één vector.
microsoftml.drop_columns Verwijdert kolommen uit een dataset.
microsoftml.select_columns Behoudt kolommen van een dataset.

Variabele selectie

Functie Description
microsoftml.count_select Selectie van kenmerken op basis van aantallen.
microsoftml.mutualinformation_select Functiekeuze gebaseerd op wederzijdse informatie.

Tekstanalyse

Functie Description
microsoftml.featurize_text Zet tekstkolommen om in numerieke kenmerken.
microsoftml.get_sentiment Sentimentanalyse.

Afbeeldingsanalyse

Functie Description
microsoftml.load_image Laadt een afbeelding.
microsoftml.resize_image Verander de grootte van een afbeelding.
microsoftml.extract_pixels Extraheren pixels uit een afbeelding.
microsoftml.featurize_image Zet een afbeelding om in features.

Featurisatiefuncties

Functie Description
microsoftml.rx_featurize Datatransformatie voor databronnen

Scorefuncties

Functie Description
microsoftml.rx_predict Scores met een Microsoft machine learning-model

Hoe microsoftml aan te roepen

Functies in microsoftml kunnen worden aangevraagd in Python-code, ingekapseld in opgeslagen procedures. De meeste ontwikkelaars bouwen MicrosoftML-oplossingen lokaal en migreren vervolgens voltooide Python-code naar stored procedures als een implementatie-oefening.

Het microsoftml-pakket voor Python is standaard geïnstalleerd, maar in tegenstelling tot revoscalepy wordt het niet standaard geladen wanneer je een Python-sessie start met de Python-uitvoerbare bestanden die met SQL Server zijn geïnstalleerd.

Als eerste stap importeer je het microsoftml-pakket , en importeer je revoscalepy als je remote compute-contexten of gerelateerde connectiviteiten of datasource-objecten nodig hebt. Raadpleeg vervolgens de afzonderlijke functies die je nodig hebt.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Zie ook