MutualInformationFeatureSelectingEstimator Classe

Riferimento

Definizione

Spazio dei nomi:: Microsoft.ML.Transforms

Assembly:: Microsoft.ML.Transforms.dll

Pacchetto:: Microsoft.ML v3.0.1

Pacchetto:: Microsoft.ML v1.0.0

Pacchetto:: Microsoft.ML v1.1.0

Pacchetto:: Microsoft.ML v1.2.0

Pacchetto:: Microsoft.ML v1.3.1

Pacchetto:: Microsoft.ML v1.4.0

Pacchetto:: Microsoft.ML v1.5.5

Pacchetto:: Microsoft.ML v1.6.0

Pacchetto:: Microsoft.ML v1.7.0

Pacchetto:: Microsoft.ML v2.0.0

Importante

Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.

Seleziona gli slot k principali in tutte le colonne specificate ordinate in base alle relative informazioni reciproche con la colonna etichetta ( informazioni sull'etichetta osservando il valore della colonna specificata).

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>

type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>

Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)

Ereditarietà: Object
MutualInformationFeatureSelectingEstimator

Implementazioni: IEstimator<ITransformer>

Commenti

Caratteristiche dello strumento di stima


Questo strumento di stima deve esaminare i dati per eseguire il training dei relativi parametri?	Sì
Tipo di dati della colonna di input	Vettore o scalare di tipi di dati numerici, di testo o di chiave
Tipo di dati della colonna di output	Uguale alla colonna di input
Esportabile in ONNX	Sì

Formalmente, l'informazione mutua può essere scritta come:

$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y))]$ dove $x$ e $y$ sono osservazioni di variabili casuali $X$ e $Y$.

dove l'aspettativa E viene presa in considerazione la distribuzione congiunta di X e Y. Qui P(x, y) è la funzione di densità di probabilità congiunta di X e Y, P(x) e P(y) sono rispettivamente le funzioni di densità di probabilità marginale di X e Y. In generale, una maggiore informazione reciproca tra la variabile dipendente(o l'etichetta) e una variabile indipendente(o funzionalità) significa che l'etichetta ha una dipendenza reciproca più elevata rispetto a tale funzionalità. Mantiene gli slot principali nelle funzionalità di output con le informazioni reciproche più grandi con l'etichetta.

Ad esempio, per la colonna Features e Label seguente, se si specifica che si desidera che i primi 2 slot(elementi vettoriali) abbiano la correlazione più elevata con la colonna etichetta, l'output dell'applicazione di questo strumento estimator manterrà solo il primo e il terzo slot, perché i relativi valori sono più correlati ai valori nella colonna Label.

Etichetta	Funzionalità
Vero	4,6,0
Falso	0,7,5
Vero	4,7,0
Falso	0,7,0

Questo è il modo in cui il set di dati precedente verrà esaminato, dopo aver appropriato lo strumento di stima e trasformato i dati con il trasformatore risultante:

Etichetta	Funzionalità
Vero	4,0
Falso	0,5
Vero	4,0
Falso	0,0

Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)	Esegue il training e restituisce un oggetto ITransformer.
GetOutputSchema(SchemaShape)	Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline.

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit.

Si applica a

Condividi tramite