microsoftml (package Python de SQL Server Machine Learning Services)
S’applique à : SQL Server 2017 (14.x) et versions ultérieures
microsoftml est un package Python de Microsoft qui fournit des algorithmes de Machine Learning hautes performances. Il comprend des fonctions d’apprentissage et de transformation, de scoring, d’analyse de texte et d’image, ainsi que d’extraction de caractéristiques pour dériver des valeurs à partir de données existantes. Le package, inclus dans SQL Server Machine Learning Services, prend en charge les opérations hautes performances sur le Big Data, l’utilisation du traitement multicœur et le streaming de données rapide.
Détails du package | Information |
---|---|
Version actuelle : | 9,4 |
Créé sur : | distribution Anaconda 4.2 de Python 3.7.1 |
Distribution du package : | SQL Server Machine Learning Services version 2017 ou 2019. |
Utiliser microsoftml
Le module microsoftml est installé en même temps que SQL Server Services Machine Learning lorsque vous ajoutez Python à votre installation. Vous bénéficiez de l'intégralité des packages propriétaires ainsi que d'une distribution Python, avec ses modules et interpréteurs. Vous pouvez utiliser n'importe quel environnement IDE Python pour écrire un script Python appelant des fonctions dans microsoftml, mais le script doit être exécuté sur un ordinateur doté de SQL Server Machine Learning Services avec Python.
Les modules microsoftml et revoscalepy sont étroitement couplés ; les sources de données utilisées dans microsoftml sont définies en tant qu'objets revoscalepy. Les limitations du contexte de calcul dans revoscalepy sont transmises à microsoftml. En d'autres termes, toutes les fonctionnalités sont disponibles pour les opérations locales, mais le passage à un contexte de calcul distant requiert RxSpark ou RxInSQLServer.
Versions et plateformes
Le module microsoftml n'est disponible que lorsque vous installez l'un des produits ou téléchargements Microsoft suivants :
- Services de Machine Learning SQL Server
- Bibliothèques clientes Python pour un client de science des données
Notes
Les versions complètes du produit sont uniquement disponibles sous Windows dans SQL Server 2017. Windows et Linux sont pris en charge pour microsoftml dans SQL Server 2019.
Dépendances de package
Les algorithmes dans microsoftml dépendent de revoscalepy pour :
- Objets source de données : les données consommées par les fonctions microsoftml sont créées à l'aide des fonctions revoscalepy.
- Informatique à distance (déplacement de l'exécution de la fonction vers une instance distante de SQL Server) : le package revoscalepy fournit des fonctions permettant de créer et d'activer un contexte de calcul distant pour SQL Server.
Dans la plupart des cas, vous devez charger les packages ensemble chaque fois que vous utilisez microsoftml.
Fonctions par catégorie
Cette section répertorie les fonctions par catégorie pour vous donner une idée de la façon dont chacune d’elles est utilisée. Vous pouvez également utiliser la table des matières pour rechercher des fonctions dans l’ordre alphabétique.
1 - Fonctions d’entraînement
Fonction | Description |
---|---|
microsoftml.rx_ensemble | Effectuer l’apprentissage d’un ensemble de modèles. |
microsoftml.rx_fast_forest | Forêt aléatoire. |
microsoftml.rx_fast_linear | Modèle linéaire. avec élévation stochastique à double coordonnée. |
microsoftml.rx_fast_trees | Arbres augmentés. |
microsoftml.rx_logistic_regression | Régression logistique. |
microsoftml.rx_neural_network | Réseau neuronal. |
microsoftml.rx_oneclass_svm | Détection d’anomalie. |
2 - Fonctions de transformation
Gestion des variables de catégorie
Fonction | Description |
---|---|
microsoftml.categorical | Convertit une colonne de texte en catégories. |
microsoftml.categorical_hash | Hache et convertit une colonne de texte en catégories. |
Manipulation de schéma
Fonction | Description |
---|---|
microsoftml.concat | Concatène plusieurs colonnes en un seul vecteur. |
microsoftml.drop_columns | Supprime des colonnes d’un jeu de données. |
microsoftml.select_columns | Conserve les colonnes d’un jeu de données. |
sélection des variables
Fonction | Description |
---|---|
microsoftml.count_select | Sélection des caractéristiques en fonction du nombre. |
microsoftml.mutualinformation_select | Sélection des caractéristiques en fonction des informations mutuelles. |
Analytique de texte
Fonction | Description |
---|---|
microsoftml.featurize_text | Convertit les colonnes de texte en caractéristiques numériques. |
microsoftml.get_sentiment | Analyse des sentiments. |
Analyse d’image
Fonction | Description |
---|---|
microsoftml.load_image | Charge une image. |
microsoftml.resize_image | Redimensionne une image. |
microsoftml.extract_pixels | Extrait les pixels d’une image. |
microsoftml.featurize_image | Convertit une image en caractéristiques. |
Fonctions de caractérisation
Fonction | Description |
---|---|
microsoftml.rx_featurize | Transformation de données pour les sources de données |
Fonctions de scoring
Fonction | Description |
---|---|
microsoftml.rx_predict | Scores à l’aide d’un modèle Machine Learning Microsoft |
Comment appeler microsoftml
Les fonctions de microsoftml peuvent être appelées dans du code Python encapsulé dans des procédures stockées. La plupart des développeurs créent des solutions microsoftml localement, puis migrent le code Python terminé vers les procédures stockées en guise d’exercice de déploiement.
Le package microsoftml pour Python est installé par défaut, mais contrairement à revoscalepy, il n’est pas chargé par défaut quand vous démarrez une session Python à l’aide des exécutables Python installés avec SQL Server.
Dans un premier temps, importez le package microsoftml et importez revoscalepy si vous devez utiliser des contextes de calcul distants ou des objets de source de données ou de connectivité associés. Ensuite, référencez les fonctions individuelles dont vous avez besoin.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource