MutualInformationFeatureSelectingEstimator Třída
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Vybere horní k sloty ve všech zadaných sloupcích seřazených podle jejich vzájemných informací se sloupcem popisku (co se o popisku dozvíte pozorováním hodnoty zadaného sloupce).
public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- Dědičnost
-
MutualInformationFeatureSelectingEstimator
- Implementuje
Poznámky
Vlastnosti nástroje pro posouzení
Potřebuje tento nástroj pro posouzení podívat se na data, aby vytrénovala své parametry? | Yes |
Datový typ vstupního sloupce | Vektor nebo skalár číselného, textového nebo klíčového datového typu |
Datový typ výstupního sloupce | Stejné jako vstupní sloupec |
Exportovat do ONNX | Yes |
Formálně lze vzájemné informace zapsat takto:
$\text{MI}(X,Y) = E_{x,y}[\log(P(x;y)) - \log(P(x)) - \log(P(y))]$, kde $x$ a $y$ jsou pozorování náhodných proměnných $X$ a $Y$.
kde očekávání E přebírá společné rozdělení X a Y. P(x, y) je společná funkce hustoty pravděpodobnosti pro X a Y, P(x) a P(y) jsou funkce hustoty mezní pravděpodobnosti X a Y. Obecně platí, že vyšší vzájemná informace mezi závislou proměnnou (nebo popiskem) a nezávislou proměnnou (nebo funkcí) znamená, že popisek má vyšší vzájemnou závislost na dané funkci. Uchovává nejvyšší sloty ve výstupních funkcích s největšími vzájemnými informacemi s popiskem.
Pokud například pro následující sloupec Funkce a popisek určíme, že chceme horní 2 sloty (vektorové prvky), které mají vyšší korelaci se sloupcem popisku, výstup použití tohoto nástroje Estimator zachová pouze první a třetí slot, protože jejich hodnoty jsou více korelovány s hodnotami ve sloupci Popisek.
Popisek | Funkce |
---|---|
Ano | 4,6,0 |
Ne | 0,7,5 |
Ano | 4,7,0 |
Ne | 0,7,0 |
Výše uvedená datová sada by po přizpůsobení odhadce a transformaci dat s výsledným transformátorem vypadala takto:
Popisek | Funkce |
---|---|
Ano | 4,0 |
Ne | 0,5 |
Ano | 4,0 |
Ne | 0,0 |
V části Viz také najdete odkazy na příklady použití.
Metody
Fit(IDataView) |
Vytrénuje a vrátí ITransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Vrátí hodnotu schématu, která bude vytvořena transformátorem. Používá se k šíření a ověřování schématu v kanálu. |
Metody rozšíření
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Připojte kontrolní bod ukládání do mezipaměti k řetězu odhadu. Tím se zajistí, že podřízené estimátory budou natrénovány na data uložená v mezipaměti. Je užitečné mít kontrolní bod ukládání do mezipaměti před školiteli, kteří mají více průchodů dat. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
V případě estimátoru vrátí objekt obtékání, který bude volat delegáta, jakmile Fit(IDataView) je volána. Pro odhadce je často důležité, aby vracel informace o tom, co bylo vhodné, a proto Fit(IDataView) metoda vrací objekt s konkrétním typem, spíše než jen obecný ITransformerobjekt . Zároveň IEstimator<TTransformer> jsou však často tvořeny kanály s mnoha objekty, takže možná budeme muset vytvořit řetězec odhadců, kde EstimatorChain<TLastTransformer> je odhadovač, pro který chceme získat transformátor, uložen někde v tomto řetězci. Pro tento scénář můžeme pomocí této metody připojit delegáta, který bude volána po zavolání fit. |