Condividi tramite


Multiclass Decision Jungle

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Crea un modello di classificazione multiclasse usando l'algoritmo di giungla delle decisioni

Categoria: Machine Learning/Inizializza modello/classificazione

Nota

Si applica a: Machine Learning Studio (versione classica)

Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.

Panoramica del modulo

Questo articolo descrive come usare il modulo Multiclass Decision Rsa in Machine Learning Studio (versione classica) per creare un modello di Machine Learning basato su un algoritmo di apprendimento supervisionato denominato decision.

È possibile definire il modello e i relativi parametri usando questo modulo e quindi connettere un set di dati di training etichettato per eseguire il training del modello usando uno dei moduli di training. Il modello con training può essere usato per stimare una destinazione con più valori.

Altre informazioni sui processi decisionali

I processi decisionali sono un'estensione recente alle foreste delle decisioni. Una giungla delle decisioni è costituita da un insieme di grafi aciclici diretti (DAG, Directed Acyclic Graph).

Le giungle delle decisioni offrono i vantaggi seguenti:

  • Permettendo l'unione dei rami dell'albero, un DAG di decisione ha in genere un impatto minore sulla memoria e offre prestazioni di generalizzazione migliori rispetto all'albero delle decisioni, anche se con un tempo di training leggermente superiore.

  • Le giungle delle decisioni sono modelli non parametrici che possono rappresentare limiti di decisione non lineari.

  • Eseguono la selezione e la classificazione integrata delle funzioni e sono resilienti in caso di funzioni con rumore.

Per altre informazioni sulla ricerca alla base di questo algoritmo di Machine Learning, vedere Decision Pdf: Compact and Rich Models for Classification (Modelli compatti e avanzati per la classificazione).

Come configurare il modello di classificazione decisionale multiclasse

  1. Aggiungere il modulo Multiclass Decision Piùclasse all'esperimento in Studio (versione classica). È possibile trovare questo modulo in Machine Learning, Inizializza modello e Classificazione.

  2. Fare doppio clic sul modulo per aprire il riquadro Proprietà.

  3. Metodo di ricampionamento, scegliere il metodo per la creazione di più alberi, in ritardo o replica.

    • Bagging: selezionare questa opzione per usare bagging, detto anche bootstrap aggregating.

      Ogni albero in una foresta delle decisioni restituisce una distribuzione gaussiana tramite stima. L'aggregazione è trovare un gaussiano i cui primi due istanti corrispondono ai momenti della combinazione di Gaussiani specificata combinando tutti i Gaussiani restituiti dai singoli alberi.

    • Replica: selezionare questa opzione per usare la replica. In questo metodo, ogni albero viene addestrato esattamente sugli stessi dati di input. La determinazione del predicato di divisione usato per ogni nodo dell'albero rimane casuale, quindi vengono creati alberi diversi.

  4. Specificare la modalità di training del modello impostando l'opzione Create trainer mode (Crea modalità di training ).

    • Parametro singolo: usare questa opzione quando si conosce la modalità di configurazione del modello.

    • Intervallo di parametri: usare questa opzione se non si è certi dei parametri migliori e si vuole usare uno sweep di parametri.

  5. Numero di DAG decisionali: indicare il numero massimo di grafi che possono essere creati nell'insieme.

  6. Profondità massima dei DAG delle decisioni: specificare la profondità massima di ogni grafo.

  7. Larghezza massima dei DAG delle decisioni: specificare la larghezza massima di ogni grafico.

  8. Numero di passaggi di ottimizzazione per livello DAG decisionale: indicare il numero di iterazioni sui dati da eseguire durante la compilazione di ogni DAG.

  9. Consenti valori sconosciuti per le funzionalità categoriche: selezionare questa opzione per creare un gruppo per i valori sconosciuti nei dati di test o convalida. Il modello potrebbe essere meno preciso per i valori noti, ma può fornire stime migliori per i nuovi valori (sconosciuti).

    Se si deseleziona questa opzione, il modello può accettare solo i valori presenti nei dati di training.

  10. Connessione un set di dati etichettato e uno dei moduli di training:

    • Se si imposta Create trainer mode (Modalità di training ) su Single Parameter (Parametro singolo), usare il modulo Train Model (Training modello).

    • Se si imposta Create trainer mode (Crea modalità di trainer ) su Parameter Range (Intervallo parametri), usare il modulo Tune Model Hyperparameters (Ottimizza iperparametre modello ). Con questa opzione, l'algoritmo scorre più combinazioni delle impostazioni fornite e determina la combinazione di valori che produce il modello migliore.

    Nota

    Se si passa un intervallo di parametri a Train Model, viene utilizzato solo il primo valore nell'elenco di intervalli di parametri.

    Se si passa un singolo set di valori di parametro al modulo Tune Model Hyperparameters ,quando si prevede un intervallo di impostazioni per ogni parametro, vengono ignorati i valori e vengono utilizzati i valori predefiniti per lo learner.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, il singolo valore specificato viene usato durante l'intera transazione, anche se altri parametri cambiano in un intervallo di valori.

  11. Eseguire l'esperimento.

Risultati

Al termine del training:

  • Per usare il modello per l'assegnazione dei punteggi, connetterlo a Score Model per stimare i valori per i nuovi esempi di input.

Esempio

Per esempi di come vengono usate le foreste delle decisioni in Machine Learning, vedere l'Azure AI Gallery:

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Per altre informazioni sul processo di training con l'opzione Replica , vedere:

Suggerimenti per l'uso

Se i dati sono limitati o si vuole ridurre al minimo il tempo impiegato per il training del modello, provare le raccomandazioni seguenti:

Set di training limitato

Se il training set include un numero limitato di istanze:

  • Creare la giungla delle decisioni usando un numero elevato di DAG di decisione, ad esempio più di 20.
  • Usare l'opzione Bagging per ripetere il campionamento.
  • Specificare un numero elevato di passaggi di ottimizzazione per ogni livello di DAG, ad esempio più di 10.000.

Tempo di training limitato

Se il training set contiene un numero elevato di istanze e il tempo di training è limitato:

  • Creare la decisione che usa un numero minore di DAG decisionali (ad esempio, 5-10).
  • Usare l'opzione Replicate per ripetere il campionamento.
  • Specificare un numero minore di passaggi di ottimizzazione per ogni livello di DAG, ad esempio meno di 2000.

Parametri del modulo

Nome Intervallo Type Predefinito Descrizione
Resampling method Qualsiasi ResamplingMethod Bagging Scegliere un metodo di ripetizione del campionamento
Number of decision DAGs >=1 Integer 8 Specifica i numero di grafi di decisione che possono essere creati nell'insieme
Maximum depth of the decision DAGs >=1 Integer 32 Specifica la profondità massima dei grafi di decisione da creare nell'insieme
Maximum width of the decision DAGs >=8 Integer 128 Specifica la larghezza massima dei grafi di decisione da creare nell'insieme
Number of optimization steps per decision DAG layer >=1000 Integer 2048 Specifica il numero di passaggi da usare per l'ottimizzazione di ogni livello del grafo di decisione
Allow unknown values for categorical features Qualsiasi Boolean True Indica se i valori sconosciuti delle funzioni categoriche esistenti possono essere mappati a una nuova funzione aggiuntiva

Output

Nome Tipo Descrizione
Untrained model ILearner interface Modello di classificazione multiclasse senza training

Vedi anche

Two-Class Decision Jungle
Classificazione
Elenco moduli A-Z