microsoftml (Python-Paket in SQL Server Machine Learning Services)
Gilt für: SQL Server 2017 (14.x) und höher
microsoftml ist ein Python-Paket von Microsoft, das leistungsstarke Machine-Learning-Algorithmen bereitstellt. Sie enthält Funktionen für Training, Transformationen, Bewertung, Text- und Bildanalyse sowie Featureextraktion zum Ableiten von Werten aus vorhandenen Daten. Das Paket ist in Machine Learning Services in SQL Server enthalten und unterstützt Hochleistung für Big Data. Dafür wird Verarbeitung mit mehreren Kernen und schnelles Datenstreaming verwendet.
Paketdetails | Informationen |
---|---|
Aktuelle Version: | 9.4 |
Basiert auf: | Anaconda 4.2-Distribution von Python 3.7.1 |
Paketverteilung: | SQL Server Machine Learning Services, Version 2017 oder 2019. |
Verwenden von microsoftml
Das Modul microsoftml wird als Teil von SQL Server Machine Learning Services installiert, wenn Sie Python Ihrer Installation hinzufügen. Sie erhalten die vollständige Sammlung proprietärer Pakete sowie eine Python-Distribution mit ihren Modulen und Interpretern. Sie können eine beliebige Python-IDE verwenden, um ein Python-Skript zu schreiben, das Funktionen in microsoftml aufruft. Das Skript muss jedoch auf einem Computer mit SQL Server Machine Learning Services mit Python ausgeführt werden.
microsoftml und revoscalepy sind eng miteinander verbunden. In microsoftsoftml verwendete Datenquellen sind als revoscalepy-Objekte definiert. Computekontextbegrenzungen in revoscalepy werden von microsoftml übernommen. Die gesamte Funktionalität für lokale Vorgänge ist zwar verfügbar, aber der Wechsel zu einem Remotecomputekontext erfordert RxSpark oder RxInSQLServer.
Versionen und Plattformen
Das Modul microsoftml ist nur verfügbar, wenn Sie eines der folgenden Microsoft-Produkte bzw. einen der folgenden Downloads installieren:
Hinweis
Vollständige Produktversionen sind in SQL Server 2017 nur unter Windows verfügbar. In SQL Server 2019 wird microsoftml sowohl unter Windows als auch unter Linux unterstützt.
Paketabhängigkeiten
Die Algorithmen folgender Elemente hängen in microsoftml von revoscalepy ab:
- Datenquellenobjekte: Die von microsoftml-Funktionen genutzten Daten werden mithilfe von revoscalepy-Funktionen erstellt.
- Remotecomputing (Verschieben der Funktionsausführung in eine SQL Server-Remoteinstanz): Das revoscalepy-Paket bietet Funktionen zum Erstellen und Aktivieren eines Remotecomputekontexts für SQL Server.
In den meisten Fällen werden die Pakete bei der Verwendung von microsoftml zusammen geladen.
Funktionen nach Kategorie
In diesem Abschnitt werden die Funktionen nach Kategorien aufgelistet, damit Sie einen Überblick über die Verwendung der einzelnen Funktionen erhalten. Im Inhaltsverzeichnis können Sie in alphabetischer Reihenfolge nach den Funktionen suchen.
1: Trainingsfunktionen
Funktion | BESCHREIBUNG |
---|---|
microsoftml.rx_ensemble | Trainiert ein Modellensemble |
microsoftml.rx_fast_forest | Zufällige Gesamtstruktur |
microsoftml.rx_fast_linear | Lineares Modell mit doppeltem stochastischen Koordinatenanstieg |
microsoftml.rx_fast_trees | Verstärkte Entscheidungsbäume |
microsoftml.rx_logistic_regression | Logistische Regression |
microsoftml.rx_neural_network | Neuronales Netzwerk |
microsoftml.rx_oneclass_svm | Erkennt Anomalien |
2: Transformationsfunktionen
Behandeln von kategorischen Variablen
Funktion | BESCHREIBUNG |
---|---|
microsoftml.categorical | Konvertiert Textspalten in Kategorien |
microsoftml.categorical_hash | Erstellt einen Hash für eine Textspalte und konvertiert diese in Kategorien |
Schemabearbeitung
Funktion | BESCHREIBUNG |
---|---|
microsoftml.concat | Verkettet mehrere Spalten zu einem einzelnen Vektor |
microsoftml.drop_columns | Löscht Spalten aus einem Dataset |
microsoftml.select_columns | Behält Spalten eines Datasets bei |
Variablenauswahl
Funktion | BESCHREIBUNG |
---|---|
microsoftml.count_select | Wählt Funktionen basierend auf Anzahlen aus |
microsoftml.mutualinformation_select | Wählt Funktionen auf der Grundlage von gegenseitigen Informationen aus |
Textanalyse
Funktion | BESCHREIBUNG |
---|---|
microsoftml.featurize_text | Konvertiert Textspalten in numerische Funktionen |
microsoftml.get_sentiment | Stimmungsanalyse |
Bildanalyse
Funktion | BESCHREIBUNG |
---|---|
microsoftml.load_image | Lädt ein Bild |
microsoftml.resize_image | Ändert die Größe eines Bilds |
microsoftml.extract_pixels | Extrahiert Pixel aus einem Bild |
microsoftml.featurize_image | Konvertiert ein Bild in Features |
Featurefunktionen
Funktion | BESCHREIBUNG |
---|---|
microsoftml.rx_featurize | Datentransformation für Datenquellen |
Bewertungsfunktionen
Funktion | BESCHREIBUNG |
---|---|
microsoftml.rx_predict | Nimmt Bewertungen unter Verwendung eines Microsoft Machine Learning-Modells vor |
Vorgehensweise beim Abrufen von microsoftml
Funktionen in microsoftml können in Python-Code aufgerufen werden, der in gespeicherten Prozeduren gekapselt ist. Die meisten Entwickler erstellen microsoftml-Lösungen lokal, und migrieren den fertigen Python-Code anschließend als Bereitstellungsübung in gespeicherte Prozeduren.
Das microsoftml-Paket für Python ist standardmäßig installiert, im Gegensatz zu revoscalepy wird es jedoch nicht standardmäßig geladen, wenn Sie eine Python-Sitzung mit den mit SQL Server installierten Python-Dateien starten.
Importieren Sie zunächst das microsoftml-Paket, und importieren Sie anschließend revoscalepy, wenn Sie Remotecomputekontexte oder zugehörige Verbindungs- oder Datenquellenobjekte verwenden müssen. Verweisen Sie dann auf die einzelnen Funktionen, die Sie benötigen.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource