FastForestRegressionFeaturizationEstimator Classe

Definizione

Oggetto IEstimator<TTransformer> per trasformare il vettore di funzionalità di input in funzionalità basate su albero.

public sealed class FastForestRegressionFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestRegressionFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestRegressionFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Ereditarietà
FastForestRegressionFeaturizationEstimator

Commenti

Colonne di input e output

I dati della colonna dell'etichetta di input devono essere Single. I dati delle colonne delle funzionalità di input devono essere un vettore di dimensioni note di Single.

Questo strumento di stima restituisce le colonne seguenti:

Nome colonna di output Tipo di colonna Descrizione
Trees Vettore di dimensioni note di Single Valori di output di tutti gli alberi. La sua dimensione è identica al numero totale di alberi nel modello dell'insieme di alberi.
Leaves Vettore di dimensioni note di Single Rappresentazione vettoriale 0-1 agli ID di tutte le foglie in cui il vettore di funzionalità di input rientra. La sua dimensione è il numero di foglie totali nel modello dell'insieme di alberi.
Paths Vettore di dimensioni note di Single Rappresentazione vettoriale 0-1 nei percorsi passati dal vettore di funzionalità di input per raggiungere le foglie. La sua dimensione è il numero di nodi non foglia nel modello dell'insieme di alberi.

Tali colonne di output sono tutte facoltative e gli utenti possono modificare i nomi. Impostare i nomi delle colonne ignorate su Null in modo che non vengano prodotti.

Dettagli stima

Questo strumento di stima produce diverse colonne di output da un modello di insieme ad albero. Si supponga che il modello contenga un solo albero delle decisioni:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Si supponga che il vettore di funzionalità di input rientra in Leaf -1. L'output Trees può essere un vettore di 1 elemento in cui l'unico valore è il valore decisionale trasportato da Leaf -1. L'output Leaves è un vettore 0-1. Se la foglia raggiunta è la $i$-th (indicizzata da $-(i+1)$ in modo che la prima foglia sia Leaf -1) nell'albero, il valore $i$-th in Leaves sarebbe 1 e tutti gli altri valori sarebbero 0. L'output Paths è una rappresentazione 0-1 dei nodi passati prima di raggiungere la foglia. L'elemento $i$-th indica Paths se viene toccato il nodo $i$-th (indicizzato da $i$). Ad esempio, raggiungere Leaf -1 il lead a $[1, 1, 0, 0]$ come Paths. Se ci sono più alberi, questo stimatore concatena Treessolo 's, 's, 's Pathsda tutti gli alberi (Leavesle informazioni del primo albero vengono prima nei vettori concatenati).

Controllare la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Produrre un oggetto TreeEnsembleModelParameters che esegue il mapping della colonna chiamata InputColumnName in input a tre colonne di output.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator aggiunge tre colonne float-vector in inputSchema. Dato una colonna vettore di funzionalità, le colonne aggiunte sono i valori di stima di tutti gli alberi, gli ID foglia che il vettore di funzionalità rientra e i percorsi di tali foglie.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training sui dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima dei training che accettano più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un stimatore, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. Spesso è importante che un stimatore restituisca informazioni su ciò che è stato adatto, che è il motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> sono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di stima tramite EstimatorChain<TLastTransformer> dove lo stimatore per cui si vuole ottenere il trasformatore è sepolto da qualche parte in questa catena. Per questo scenario, è possibile collegare questo metodo a un delegato che verrà chiamato una volta che viene chiamato fit.

Si applica a

Vedi anche