Share via


Albero delle decisioni incrementato a più classi

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello di Machine Learning basato sull'algoritmo degli alberi delle decisioni con boosting.

Un albero delle decisioni con boosting è un metodo di apprendimento completo in cui il secondo albero corregge gli errori del primo albero, il terzo albero corregge gli errori del primo e del secondo albero e così via. Le stime sono basate sull'insieme di alberi.

Modalità di configurazione

Questo componente crea un modello di classificazione non sottoposto a training. Poiché la classificazione è un metodo di apprendimento supervisionato, è necessario un set di dati etichettato che include una colonna etichetta con un valore per tutte le righe.

È possibile eseguire il training di questo tipo di modello usando training modello.

  1. Aggiungere il componente Albero delle decisioni con boosting multiclasse alla pipeline.

  2. Specificare la modalità di training del modello impostando l'opzione Crea modalità di training .

    • Singolo parametro: se si sa come si vuole configurare il modello, è possibile specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: selezionare questa opzione se non si è certi dei parametri migliori e si vuole eseguire uno sweep di parametri. Selezionare un intervallo di valori per scorrere e ottimizzare gli iperparametri del modello esegue l'iterazione su tutte le possibili combinazioni delle impostazioni fornite per determinare gli iperparametri che producono i risultati ottimali.

  3. Il numero massimo di foglie per albero limita il numero massimo di nodi terminale (foglie) che possono essere creati in qualsiasi albero.

    Aumentando questo valore, si aumentano potenzialmente le dimensioni dell'albero e si ottiene una maggiore precisione, a rischio di overfitting e tempo di training più lungo.

  4. Il numero minimo di campioni per nodo foglia indica il numero di case necessari per creare qualsiasi nodo terminale (foglia) in un albero.

    Aumentando questo valore, aumenta la soglia per la creazione di nuove regole. Ad esempio, con un valore predefinito di 1, anche un singolo caso può determinare la creazione di una nuova regola. Se si aumenta il valore a 5, i dati di training devono contenere almeno cinque casi che soddisfano le stesse condizioni.

  5. La frequenza di apprendimento definisce le dimensioni del passaggio durante l'apprendimento. Immettere un numero compreso tra 0 e 1.

    La velocità di apprendimento determina la velocità o la lentezza con cui l'apprendimento converge su una soluzione ottimale. Se le dimensioni del passaggio sono troppo grandi, è possibile superare la soluzione ottimale. Se la dimensione del passaggio è troppo piccola, il training richiede più tempo per convergere sulla soluzione migliore.

  6. Il numero di alberi costruiti indica il numero totale di alberi delle decisioni da creare nell'insieme. Creando più alberi delle decisioni, è possibile ottenere una migliore copertura, ma saranno necessari tempi di training maggiori.

  7. Il valore di inizializzazione numero casuale imposta facoltativamente un intero non negativo da usare come valore di inizializzazione casuale. La specifica di un valore di inizializzazione garantisce la riproducibilità tra esecuzioni con gli stessi dati e parametri.

    Il valore di inizializzazione casuale è impostato per impostazione predefinita su 42. Le esecuzioni successive che usano semi casuali diversi possono avere risultati diversi.

  8. Eseguire il training del modello:

    • Se si imposta Crea modalità di training su Parametro singolo, connettere un set di dati con tag e il componente Train Model .

    • Se si imposta Crea modalità di training su Intervallo di parametri, connettere un set di dati con tag ed eseguire il training del modello usando Tune Model Hyperparameters.

    Nota

    Se si passa un intervallo di parametri a Train Model, viene usato solo il valore predefinito nell'elenco dei singoli parametri.

    Se si passa un singolo set di valori di parametro al componente Tune Model Hyperparameters , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per lo strumento di apprendimento.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.