MutualInformationFeatureSelectingEstimator Třída

Reference

Definice

Obor názvů:: Microsoft.ML.Transforms

Sestavení:: Microsoft.ML.Transforms.dll

Balíček:: Microsoft.ML v3.0.1

Balíček:: Microsoft.ML v1.0.0

Balíček:: Microsoft.ML v1.1.0

Balíček:: Microsoft.ML v1.2.0

Balíček:: Microsoft.ML v1.3.1

Balíček:: Microsoft.ML v1.4.0

Balíček:: Microsoft.ML v1.5.5

Balíček:: Microsoft.ML v1.6.0

Balíček:: Microsoft.ML v1.7.0

Balíček:: Microsoft.ML v2.0.0

Důležité

Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.

Vybere horní k sloty ve všech zadaných sloupcích seřazených podle jejich vzájemných informací se sloupcem popisku (co se o popisku dozvíte pozorováním hodnoty zadaného sloupce).

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>

type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>

Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)

Dědičnost: Object
MutualInformationFeatureSelectingEstimator

Implementuje: IEstimator<ITransformer>

Poznámky

Vlastnosti nástroje pro posouzení


Potřebuje tento nástroj pro posouzení podívat se na data, aby vytrénovala své parametry?	Yes
Datový typ vstupního sloupce	Vektor nebo skalár číselného, textového nebo klíčového datového typu
Datový typ výstupního sloupce	Stejné jako vstupní sloupec
Exportovat do ONNX	Yes

Formálně lze vzájemné informace zapsat takto:

$\text{MI}(X,Y) = E_{x,y}[\log(P(x;y)) - \log(P(x)) - \log(P(y))]$, kde $x$ a $y$ jsou pozorování náhodných proměnných $X$ a $Y$.

kde očekávání E přebírá společné rozdělení X a Y. P(x, y) je společná funkce hustoty pravděpodobnosti pro X a Y, P(x) a P(y) jsou funkce hustoty mezní pravděpodobnosti X a Y. Obecně platí, že vyšší vzájemná informace mezi závislou proměnnou (nebo popiskem) a nezávislou proměnnou (nebo funkcí) znamená, že popisek má vyšší vzájemnou závislost na dané funkci. Uchovává nejvyšší sloty ve výstupních funkcích s největšími vzájemnými informacemi s popiskem.

Pokud například pro následující sloupec Funkce a popisek určíme, že chceme horní 2 sloty (vektorové prvky), které mají vyšší korelaci se sloupcem popisku, výstup použití tohoto nástroje Estimator zachová pouze první a třetí slot, protože jejich hodnoty jsou více korelovány s hodnotami ve sloupci Popisek.

Popisek	Funkce
Ano	4,6,0
Ne	0,7,5
Ano	4,7,0
Ne	0,7,0

Výše uvedená datová sada by po přizpůsobení odhadce a transformaci dat s výsledným transformátorem vypadala takto:

Popisek	Funkce
Ano	4,0
Ne	0,5
Ano	4,0
Ne	0,0

V části Viz také najdete odkazy na příklady použití.

Metody

Fit(IDataView)	Vytrénuje a vrátí ITransformer.
GetOutputSchema(SchemaShape)	SchemaShape Vrátí hodnotu schématu, která bude vytvořena transformátorem. Používá se k šíření a ověřování schématu v kanálu.

Metody rozšíření

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Připojte kontrolní bod ukládání do mezipaměti k řetězu odhadu. Tím se zajistí, že podřízené estimátory budou natrénovány na data uložená v mezipaměti. Je užitečné mít kontrolní bod ukládání do mezipaměti před školiteli, kteří mají více průchodů dat.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

V případě estimátoru vrátí objekt obtékání, který bude volat delegáta, jakmile Fit(IDataView) je volána. Pro odhadce je často důležité, aby vracel informace o tom, co bylo vhodné, a proto Fit(IDataView) metoda vrací objekt s konkrétním typem, spíše než jen obecný ITransformerobjekt . Zároveň IEstimator<TTransformer> jsou však často tvořeny kanály s mnoha objekty, takže možná budeme muset vytvořit řetězec odhadců, kde EstimatorChain<TLastTransformer> je odhadovač, pro který chceme získat transformátor, uložen někde v tomto řetězci. Pro tento scénář můžeme pomocí této metody připojit delegáta, který bude volána po zavolání fit.

Platí pro

Sdílet prostřednictvím