Condividi tramite


PretrainedTreeFeaturizationEstimator Classe

Definizione

Oggetto IEstimator<TTransformer> che contiene un pre-training TreeEnsembleModelParameters e chiamarne Fit(IDataView) produce un featurizer basato sul modello pre-sottoposto a training.

public sealed class PretrainedTreeFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type PretrainedTreeFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class PretrainedTreeFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Ereditarietà
PretrainedTreeFeaturizationEstimator

Commenti

Colonne di input e output

I dati della colonna dell'etichetta di input devono essereSingle. I dati delle colonne delle funzionalità di input devono essere un vettore di dimensioni note.Single

Questo strumento di stima restituisce le colonne seguenti:

Nome colonna di output Tipo di colonna Descrizione
Trees Vettore diSingle Valori di output di tutti gli alberi.
Leaves Vettore di Single Gli ID di tutte le foglie in cui il vettore di funzionalità di input rientra.
Paths Vettore di Single I percorsi del vettore di funzionalità di input passati per raggiungere le foglie.

Tali colonne di output sono tutte facoltative e gli utenti possono modificare i nomi. Impostare i nomi delle colonne ignorate su Null in modo che non vengano prodotti.

Dettagli stima

Questo strumento di stima produce diverse colonne di output da un modello di insieme ad albero. Si supponga che il modello contenga un solo albero delle decisioni:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Si supponga che il vettore di funzionalità di input rientra in Leaf -1. L'output Trees può essere un vettore di 1 elemento in cui l'unico valore è il valore decisionale trasportato da Leaf -1. L'output Leaves è un vettore 0-1. Se la foglia raggiunta è la $i$-th (indicizzata da $-(i+1)$ in modo che la prima foglia sia Leaf -1) nell'albero, il valore $i$-th in Leaves sarebbe 1 e tutti gli altri valori sarebbero 0. L'output Paths è una rappresentazione 0-1 dei nodi passati prima di raggiungere la foglia. L'elemento $i$-th indica Paths se viene toccato il nodo $i$-th (indicizzato da $i$). Ad esempio, raggiungere Leaf -1 il lead a $[1, 1, 0, 0]$ come Paths. Se ci sono più alberi, questo stimatore concatena Treessolo 's, 's, 's Pathsda tutti gli alberi (Leavesle informazioni del primo albero vengono prima nei vettori concatenati).

Controllare la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Produrre un oggetto TreeEnsembleModelParameters che esegue il mapping della colonna chiamata InputColumnName in input a tre colonne di output.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator aggiunge tre colonne float-vector in inputSchema. Dato una colonna vettore di funzionalità, le colonne aggiunte sono i valori di stima di tutti gli alberi, gli ID foglia che il vettore di funzionalità rientra e i percorsi di tali foglie.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training sui dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima dei training che accettano più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un stimatore, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. Spesso è importante che un stimatore restituisca informazioni su ciò che è stato adatto, che è il motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> sono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di stima tramite EstimatorChain<TLastTransformer> dove lo stimatore per cui si vuole ottenere il trasformatore è sepolto da qualche parte in questa catena. Per questo scenario, è possibile collegare questo metodo a un delegato che verrà chiamato una volta che viene chiamato fit.

Si applica a

Vedi anche