Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Usage
microsoftml.mutualinformation_select(cols: [list, str], label: str,
num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)
Description
Vybere horní k funkce ve všech zadaných sloupcích seřazených podle jejich vzájemných informací se sloupcem popisku.
Podrobnosti
Vzájemné informace o dvou náhodných proměnných X a Y je měřítkem vzájemné závislosti mezi proměnnými. Formálně lze vzájemné informace zapsat takto:
I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]
pokud je očekávání převzato ze společného rozdělení X a Y. Zde p(x,y) je funkce X hustoty pravděpodobnosti společného rozdělení a Yp(x) a p(y) jsou mezními funkcemi X hustoty pravděpodobnosti a Y v uvedeném pořadí. Obecně platí, že vyšší vzájemné informace mezi závislou proměnnou (nebo popiskem) a nezávislou proměnnou (nebo funkcí) znamená, že popisek má větší vzájemnou závislost na této funkci.
Režim výběru funkce vzájemného informací vybere funkce na základě vzájemných informací. Uchovává nejvyšší num_features_to_keep funkce s největšími vzájemnými informacemi s popiskem.
Arguments
Cols
Určuje řetězec znaků nebo seznam názvů proměnných, které chcete vybrat.
jmenovka
Určuje název popisku.
num_features_to_keep
Pokud je zadaný počet funkcí, které mají být nzachovány, transformace vybere n funkce, které mají nejvyšší vzájemné informace se závislými proměnnými. Výchozí hodnota je 1000.
num_bins
Maximální počet intervalů pro číselné hodnoty Doporučuje se výkon 2. Výchozí hodnota je 256.
kargs
Další argumenty odeslané do výpočetního modulu
Návraty
Objekt definující transformaci.