Scegliere i parametri per ottimizzare gli algoritmi in Machine Learning Studio (versione classica)

SI APPLICA A: Si applica a. Machine Learning Studio (versione classica) Non si applica a. di Azure Machine Learning

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

Vedere le informazioni sullo spostamento di progetti di apprendimento automatico da ML Studio (versione classica) ad Azure Machine Learning.
Scoprire di più su Azure Machine Learning

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo argomento descrive come scegliere il set di iperparametri corretto per un algoritmo in Machine Learning Studio (versione classica). Per la maggior parte degli algoritmi di Machine Learning è necessario impostare i parametri. Quando si esegue il training di un modello, è necessario specificare valori per questi parametri. L'efficacia del modello addestrato dipende dai parametri scelti per il modello. Il processo per trovare il set ottimale di parametri è noto come selezione del modello.

Ci sono vari modi per selezionare un modello. In Machine Learning la convalida incrociata è uno dei metodi più diffusi per la selezione del modello ed è il meccanismo di selezione del modello predefinito in Machine Learning Studio (versione classica). Poiché Machine Learning Studio (versione classica) supporta sia R che Python, è sempre possibile implementare i propri meccanismi di selezione del modello usando R o Python.

Il processo per trovare il migliore set di parametri è costituito da quattro passaggi:

Definire lo spazio del parametro: prima decidere i valori esatti dei parametri che si vogliono prendere in considerazione per l'algoritmo.
Definire le impostazioni di convalida incrociata: decidere come scegliere le suddivisioni di convalida incrociata per il set di dati.
Definire la metrica: decidere quale metrica usare per determinare il migliore set di parametri, ad esempio, l'accuratezza, l'errore quadratico medio, la precisione, il richiamo, o il punteggio f.
Eseguire il training, valutare e confrontare: per ogni combinazione univoca dei valori dei parametri, la convalida incrociata si effettua in base alla metrica di errore che definisci. Dopo valutazione e confronto, è possibile scegliere il modello con le prestazioni migliori.

L'immagine seguente illustra come ottenere questo risultato in Machine Learning Studio (versione classica).

Trovare il miglior set di parametri

Definire lo spazio dei parametri

Il set di parametri può essere definito nella fase di inizializzazione del modello. Il pannello dei parametri di tutti gli algoritmi di Machine Learning presenta due modalità di training: parametro singolo e intervallo di parametri. Scegliere la modalità intervallo dei parametri. Nella modalità intervallo di parametri è possibile immettere più valori per ogni parametro. Nella casella di testo è possibile immettere valori delimitati da virgole.

Albero decisionale a due classi potenziato, singolo parametro

In alternativa è possibile definire il punto massimo e minimo della griglia e il numero totale dei punti da generare con Use Range Builder. Per impostazione predefinita, i valori dei parametri vengono generati su una scala lineare. Ma se è selezionata l'opzione Scala logaritmica, i valori vengono generati in scala logaritmica (ovvero, il rapporto dei punti adiacenti è costante invece di rappresentare la loro differenza). Per i parametri Integer, è possibile definire un intervallo tramite un segno meno. Ad esempio, "1-10" indica che tutti i numeri interi compresi tra 1 e 10 (inclusi) formano il set di parametri. È supportata anche una modalità mista. Ad esempio, il set di parametri "1-10, 20, 50" include valori interi da 1 a 10, 20 e 50.

Albero decisionale potenziato a due classi, intervallo di parametri

Definire suddivisioni della convalida incrociata

Il modulo Partition and Sample (Partizionamento e campionamento) può essere usato per assegnare riduzioni ai dati in modo casuale. Nella configurazione di esempio seguente del modulo, vengono definite cinque riduzioni e viene assegnato in modo casuale un numero di riduzione alle istanze dell'esempio.

Partizione e campione

Definire la metrica

Il modulo Tune Model Hyperparameters fornisce supporto per scegliere in modo empirico il miglior set di parametri per un algoritmo e un set di dati specifici. Oltre ad altre informazioni sul training del modello, il riquadro Properties (Proprietà) di questo modulo include la metrica per determinare il miglior set di parametri. E ha due elenchi a discesa rispettivamente per gli algoritmi di classificazione e di regressione. Se l'algoritmo in esame è un algoritmo di classificazione, la metrica di regressione viene ignorata e viceversa. In questo esempio specifico la metrica è Accuracy (Accuratezza).

Parametri di scansione

Addestrare, valutare e confrontare

Lo stesso modulo Tune Model Hyperparameters esegue il training di tutti i modelli corrispondenti al set di parametri, valuta diverse metriche e crea il miglior modello in base alla metrica scelta. Tale modulo dispone di due input obbligatori:

Allievo non formato
Set di dati

Il modulo contiene anche un set di dati di input facoltativo. Collega il set di dati con le informazioni sui fold all'input obbligatorio del set di dati. Se al set di dati non vengono assegnate informazioni di riduzione, per impostazione predefinita viene eseguita automaticamente una convalida incrociata a 10 riduzioni. Se l'assegnazione di fold non viene eseguita e viene fornito un set di dati di convalida alla porta del set di dati facoltativo, viene scelta la modalità di train-test e il primo set di dati viene utilizzato per eseguire il training del modello per ogni combinazione di parametri.

Classificatore dell'albero delle decisioni potenziato

Il modello viene quindi valutato sul set di dati di convalida. La porta di output sinistra del modulo visualizza metriche diverse come funzioni dei valori del parametro. La porta di output destra restituisce il modello addestrato che corrisponde al modello con le migliori prestazioni secondo la metrica scelta (in questo caso Accuracy).

Set di dati di convalida

È possibile vedere esattamente i parametri scelti visualizzando la porta di output destra. Questo modello può essere utilizzato per la valutazione in un set di test o in un servizio web operativo dopo il salvataggio come modello per il training.

Last updated on 2017-11-29

Scegliere i parametri per ottimizzare gli algoritmi in Machine Learning Studio (versione classica)

Definire lo spazio dei parametri

Definire suddivisioni della convalida incrociata

Definire la metrica

Addestrare, valutare e confrontare

Risorse aggiuntive