Sdílet prostřednictvím


microsoftml.mutualinformation_select: Výběr funkcí na základě vzájemných informací

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Vybere horní k funkce ve všech zadaných sloupcích seřazených podle jejich vzájemných informací se sloupcem popisku.

Podrobnosti

Vzájemné informace o dvou náhodných proměnných X a Y je měřítkem vzájemné závislosti mezi proměnnými. Formálně lze vzájemné informace zapsat takto:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

pokud je očekávání převzato ze společného rozdělení X a Y. Zde p(x,y) je funkce X hustoty pravděpodobnosti společného rozdělení a Yp(x) a p(y) jsou mezními funkcemi X hustoty pravděpodobnosti a Y v uvedeném pořadí. Obecně platí, že vyšší vzájemné informace mezi závislou proměnnou (nebo popiskem) a nezávislou proměnnou (nebo funkcí) znamená, že popisek má větší vzájemnou závislost na této funkci.

Režim výběru funkce vzájemného informací vybere funkce na základě vzájemných informací. Uchovává nejvyšší num_features_to_keep funkce s největšími vzájemnými informacemi s popiskem.

Arguments

Cols

Určuje řetězec znaků nebo seznam názvů proměnných, které chcete vybrat.

jmenovka

Určuje název popisku.

num_features_to_keep

Pokud je zadaný počet funkcí, které mají být nzachovány, transformace vybere n funkce, které mají nejvyšší vzájemné informace se závislými proměnnými. Výchozí hodnota je 1000.

num_bins

Maximální počet intervalů pro číselné hodnoty Doporučuje se výkon 2. Výchozí hodnota je 256.

kargs

Další argumenty odeslané do výpočetního modulu

Návraty

Objekt definující transformaci.

Viz také

count_select

Odkazy

Wikipedie: Vzájemné informace