Sdílet prostřednictvím


MutualInformationFeatureSelectingEstimator Třída

Definice

Vybere horní k sloty ve všech zadaných sloupcích seřazených podle jejich vzájemných informací se sloupcem popisku (co se o popisku dozvíte pozorováním hodnoty zadaného sloupce).

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Dědičnost
MutualInformationFeatureSelectingEstimator
Implementuje

Poznámky

Vlastnosti nástroje pro posouzení

Potřebuje tento nástroj pro posouzení podívat se na data, aby vytrénovala své parametry? Yes
Datový typ vstupního sloupce Vektor nebo skalár číselného, textového nebo klíčového datového typu
Datový typ výstupního sloupce Stejné jako vstupní sloupec
Exportovat do ONNX Yes

Formálně lze vzájemné informace zapsat takto:

$\text{MI}(X,Y) = E_{x,y}[\log(P(x;y)) - \log(P(x)) - \log(P(y))]$, kde $x$ a $y$ jsou pozorování náhodných proměnných $X$ a $Y$.

kde očekávání E přebírá společné rozdělení X a Y. P(x, y) je společná funkce hustoty pravděpodobnosti pro X a Y, P(x) a P(y) jsou funkce hustoty mezní pravděpodobnosti X a Y. Obecně platí, že vyšší vzájemná informace mezi závislou proměnnou (nebo popiskem) a nezávislou proměnnou (nebo funkcí) znamená, že popisek má vyšší vzájemnou závislost na dané funkci. Uchovává nejvyšší sloty ve výstupních funkcích s největšími vzájemnými informacemi s popiskem.

Pokud například pro následující sloupec Funkce a popisek určíme, že chceme horní 2 sloty (vektorové prvky), které mají vyšší korelaci se sloupcem popisku, výstup použití tohoto nástroje Estimator zachová pouze první a třetí slot, protože jejich hodnoty jsou více korelovány s hodnotami ve sloupci Popisek.

Popisek Funkce
Ano 4,6,0
Ne 0,7,5
Ano 4,7,0
Ne 0,7,0

Výše uvedená datová sada by po přizpůsobení odhadce a transformaci dat s výsledným transformátorem vypadala takto:

Popisek Funkce
Ano 4,0
Ne 0,5
Ano 4,0
Ne 0,0

V části Viz také najdete odkazy na příklady použití.

Metody

Fit(IDataView)

Vytrénuje a vrátí ITransformer.

GetOutputSchema(SchemaShape)

SchemaShape Vrátí hodnotu schématu, která bude vytvořena transformátorem. Používá se k šíření a ověřování schématu v kanálu.

Metody rozšíření

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Připojte kontrolní bod ukládání do mezipaměti k řetězu odhadu. Tím se zajistí, že podřízené estimátory budou natrénovány na data uložená v mezipaměti. Je užitečné mít kontrolní bod ukládání do mezipaměti před školiteli, kteří mají více průchodů dat.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

V případě estimátoru vrátí objekt obtékání, který bude volat delegáta, jakmile Fit(IDataView) je volána. Pro odhadce je často důležité, aby vracel informace o tom, co bylo vhodné, a proto Fit(IDataView) metoda vrací objekt s konkrétním typem, spíše než jen obecný ITransformerobjekt . Zároveň IEstimator<TTransformer> jsou však často tvořeny kanály s mnoha objekty, takže možná budeme muset vytvořit řetězec odhadců, kde EstimatorChain<TLastTransformer> je odhadovač, pro který chceme získat transformátor, uložen někde v tomto řetězci. Pro tento scénář můžeme pomocí této metody připojit delegáta, který bude volána po zavolání fit.

Platí pro

Viz také