microsoftml (Python-paket i SQL Server Machine Learning Services)

Gäller för: SQL Server 2017 (14.x) och senare versioner

microsoftml är ett Python-paket från Microsoft som tillhandahåller högpresterande maskininlärningsalgoritmer. Den inkluderar funktioner för träning och transformationer, poängräkning, text- och bildanalys samt funktionsextraktion för att härleda värden från befintlig data. Paketet ingår i SQL Server Machine Learning Services och stödjer hög prestanda på big data, användning av flerkärnig bearbetning och snabb dataströmning.

Paketinformation Information
Nuvarande version: 9,4
Byggt på: Anaconda 4.2-distribution av Python 3.7.1
Paketdistribution: SQL Server Machine Learning Services version 2017 eller 2019.

Hur man använder microsoftml

MicrosoftML-modulen installeras som en del av SQL Server Machine Learning Services när du lägger till Python i din installation. Du får hela samlingen av proprietära paket plus en Python-distribution med dess moduler och tolkar. Du kan använda vilken Python-IDE som helst för att skriva Python-skriptanrop i microsoftml, men skriptet måste köras på en dator med SQL Server Machine Learning Services och Python.

Microsoftml och revoscalepy är tätt kopplade; Datakällor som används i MicrosoftML definieras som revoscalepy-objekt . Beräkningskontextbegränsningar i revoscalepy överförs till microsoftml. Nämligen att all funktionalitet finns tillgänglig för lokala operationer, men att byta till en fjärrberäkningskontext kräver RxSpark eller RxInSQLServer.

Versioner och plattformar

MicrosoftML-modulen är endast tillgänglig när du installerar någon av följande Microsoft-produkter eller nedladdningar:

Anmärkning

Fullständiga produktversioner finns endast för Windows i SQL Server 2017. Både Windows och Linux stöds för microsoftml i SQL Server 2019.

Paketberoenden

Algoritmer i microsoftml är beroende av revoscalepy för:

  • Datakällobjekt – Data som konsumeras av microsoftml-funktioner skapas med hjälp av revoscalepy-funktioner .
  • Fjärrberäkning (att flytta funktionsexekvering till en fjärrinstans av SQL Server) – Paketet revoscalepy tillhandahåller funktioner för att skapa och aktivera en fjärrberäkningskontext för SQL Server.

I de flesta fall kommer du att ladda paketen tillsammans när du använder microsoftml.

Funktioner efter kategori

Detta avsnitt listar funktionerna per kategori för att ge dig en uppfattning om hur varje funktion används. Du kan också använda innehållsförteckningen för att hitta funktioner i alfabetisk ordning.

1-Utbildningsfunktioner

Funktion Description
microsoftml.rx_ensemble Träna en ensemble av modeller.
microsoftml.rx_fast_forest Slumpmässig skog.
microsoftml.rx_fast_linear Linjär modell. med stokastisk dubbelkoordinatuppstigning.
microsoftml.rx_fast_trees Förstärkta träd.
microsoftml.rx_logistic_regression Logistisk regression.
microsoftml.rx_neural_network Neuralt nätverk.
microsoftml.rx_oneclass_svm Avvikelsedetektion.

2-transformfunktioner

Hantering av kategoriska variabler

Funktion Description
MicrosoftML.Categorical Omvandlar en textkolumn till kategorier.
microsoftml.categorical_hash Hashar och konverterar en textkolumn till kategorier.

Schemamanipulering

Funktion Description
MicrosoftML.concat Sammanfogar flera kolumner till en enda vektor.
microsoftml.drop_columns Tar bort kolumner från en datamängd.
microsoftml.select_columns Behåller kolumner i en dataset.

Variabelval

Funktion Description
microsoftml.count_select Funktionsval baserat på antal antal.
microsoftml.mutualinformation_select Val av funktioner baserat på ömsesidig information.

Textanalys

Funktion Description
microsoftml.featurize_text Omvandlar textkolumner till numeriska funktioner.
microsoftml.get_sentiment Sentimentanalys.

Bildanalys

Funktion Description
microsoftml.load_image Laddar en bild.
microsoftml.resize_image Ändra storlek på en bild.
microsoftml.extract_pixels Extraherar pixlar från en bild.
microsoftml.featurize_image Omvandlar en bild till funktioner.

Featuriseringsfunktioner

Funktion Description
microsoftml.rx_featurize Datatransformation för datakällor

Poängfunktioner

Funktion Description
microsoftml.rx_predict Poäng med hjälp av en Microsoft-maskininlärningsmodell

Hur man anropar microsoftml

Funktioner i microsoftml kan anropas i Python-kod inkapslade i lagrade procedurer. De flesta utvecklare bygger microsoftml-lösningar lokalt och migrerar sedan färdig Python-kod till lagrade procedurer som en implementeringsövning.

MicrosoftML-paketet för Python installeras som standard, men till skillnad från revoscalepy laddas det inte som standard när du startar en Python-session med Python-exekverbara filer installerade med SQL Server.

Som ett första steg, importera microsoftml-paketet och importera revoscalepy om du behöver använda fjärrberäkningskontexter eller relaterade anslutningar eller datakällobjekt. Referera sedan till de enskilda funktioner du behöver.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Se även