microsoftml (pacchetto Python in Machine Learning Services per SQL Server)
Si applica a: SQL Server 2017 (14.x) e versioni successive
microsoftml è un pacchetto Python di Microsoft che fornisce algoritmi di Machine Learning con prestazioni elevate. Include funzioni per il training e le trasformazioni, l'assegnazione dei punteggi, l'analisi di testo e immagini e l'estrazione di caratteristiche per la derivazione di valori da dati esistenti. Il pacchetto è incluso in Machine Learning Services per SQL Server e offre prestazioni elevate per i Big Data, con l'elaborazione multicore e un flusso dei dati rapido.
Dettagli del pacchetto | Informazioni |
---|---|
Versione corrente: | 9.4 |
Basato su: | Distribuzione Anaconda 4.2 di Python 3.7.1 |
Distribuzione pacchetto: | SQL Server Machine Learning Services versione 2017 o 2019. |
Come usare microsoftml
Il modulo microsoftml viene installato come parte di SQL Server Machine Learning Services quando si aggiunge Python all'installazione. Si ottiene la raccolta completa di pacchetti proprietari e una distribuzione Python con i relativi moduli e interpreti. È possibile usare qualsiasi IDE Python per scrivere funzioni di chiamata di script Python in microsoftml, ma lo script deve essere eseguito in un computer con SQL Server Machine Learning Services con Python.
Microsoftml e revoscalepy sono strettamente collegati. Le origini dati usate in microsoftml sono definite come oggetti revoscalepy. Le limitazioni del contesto di calcolo in revoscalepy vengono trasferite a microsoftml. In particolare, tutte le funzionalità sono disponibili per le operazioni locali, ma per passare a un contesto di calcolo remoto è necessario RxSpark o RxInSQLServer.
Versioni e piattaforme
Il modulo microsoftml è disponibile solo quando si installa uno dei prodotti o download Microsoft seguenti:
Nota
Le versioni complete del prodotto sono solo per Windows in SQL Server 2017. Sia Windows che Linux sono supportati per microsoftml in SQL Server 2019.
Dipendenze dei pacchetti
Gli algoritmi in microsoftml dipendono da revoscalepy per:
- Oggetti di origine dati: i dati utilizzati dalle funzioni di microsoftml vengono creati usando le funzioni di revoscalepy.
- Remote computing (spostamento dell'esecuzione di funzioni in un'istanza remota di SQL Server): il pacchetto revoscalepy fornisce funzioni per la creazione e l'attivazione di un contesto di calcolo remoto per SQL Server.
Nella maggior parte dei casi, i pacchetti vengono caricati insieme ogni volta che si usa microsoftml.
Funzioni per categoria
Questa sezione elenca le funzioni per categoria per offrire un'idea di come vengono usate. È anche possibile usare il sommario per trovare le funzioni in ordine alfabetico.
1 - Funzioni di training
Funzione | Descrizione |
---|---|
microsoftml.rx_ensemble | Esegue il training di un insieme di modelli. |
microsoftml.rx_fast_forest | Foresta casuale. |
microsoftml.rx_fast_linear | Modello lineare con crescita a doppia coordinata stocastica. |
microsoftml.rx_fast_trees | Alberi con boosting. |
microsoftml.rx_logistic_regression | Regressione logistica. |
microsoftml.rx_neural_network | Rete neurale. |
microsoftml.rx_oneclass_svm | Rilevamento di anomalie. |
2 - Funzioni di trasformazione
Gestione delle variabili di categoria
Funzione | Descrizione |
---|---|
microsoftml.categorical | Converte una colonna di testo in categorie. |
microsoftml.categorical_hash | Esegue l'hashing e converte una colonna di testo in categorie. |
Manipolazione dello schema
Funzione | Descrizione |
---|---|
microsoftml.concat | Concatena più colonne in un singolo vettore. |
microsoftml.drop_columns | Elimina le colonne da un set di dati. |
microsoftml.select_columns | Mantiene le colonne di un set di dati. |
selezione di variabili
Funzione | Descrizione |
---|---|
microsoftml.count_select | Seleziona le caratteristiche in base a conteggi. |
microsoftml.mutualinformation_select | Seleziona le caratteristiche in base a informazioni reciproche. |
Analisi del testo
Funzione | Descrizione |
---|---|
microsoftml.featurize_text | Converte le colonne di testo in caratteristiche numeriche. |
microsoftml.get_sentiment | Analisi di valutazione. |
Analisi delle immagini
Funzione | Descrizione |
---|---|
microsoftml.load_image | Carica un'immagine. |
microsoftml.resize_image | Ridimensiona un'immagine. |
microsoftml.extract_pixels | Estrae i pixel da un'immagine. |
microsoftml.featurize_image | Converte un'immagine in caratteristiche. |
Funzioni di definizione delle caratteristiche
Funzione | Descrizione |
---|---|
microsoftml.rx_featurize | Trasformazione dei dati per le origini dati |
Funzioni di assegnazione dei punteggi
Funzione | Descrizione |
---|---|
microsoftml.rx_predict | Assegna punteggi usando un modello di Machine Learning Microsoft |
Come chiamare microsoftml
Le funzioni in microsoftml possono essere chiamate nel codice Python incapsulato nelle stored procedure. La maggior parte degli sviluppatori compila in locale le soluzioni microsoftml e quindi esegue la migrazione del codice Python completato alle stored procedure, come esercizio di distribuzione.
Il pacchetto microsoftml per Python viene installato per impostazione predefinita, ma a differenza di revoscalepy, non viene caricato per impostazione predefinita quando si avvia una sessione Python usando i file eseguibili di Python installati con SQL Server.
Per prima cosa, importare il pacchetto microsoftml e quindi importare revoscalepy se è necessario usare contesti di calcolo remoti oppure oggetti di origine dati o connettività correlati. Fare quindi riferimento alle singole funzioni necessarie.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource