Udostępnij za pośrednictwem


MutualInformationFeatureSelectingEstimator Klasa

Definicja

Wybiera górne gniazda k we wszystkich określonych kolumnach uporządkowanych przez ich wzajemne informacje z kolumną etykiety (co można dowiedzieć się o etykiecie, obserwując wartość określonej kolumny).

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Dziedziczenie
MutualInformationFeatureSelectingEstimator
Implementuje

Uwagi

Charakterystyka narzędzia do szacowania

Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? Tak
Typ danych kolumny wejściowej Wektor lub skalarny typów danych liczbowych, tekstowych lub kluczowych
Typ danych kolumny wyjściowej Tak samo jak kolumna wejściowa
Eksportowanie do pliku ONNX Tak

Formalnie wzajemne informacje mogą być napisane jako:

$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y))]$, gdzie $x$ i $y$ to obserwacje zmiennych losowych $X$ i $Y$.

w przypadku gdy oczekiwanie E jest przejmowane przez wspólną dystrybucję X i Y. Tutaj P(x, y) jest wspólną funkcją gęstości prawdopodobieństwa X i Y, P(x) i P(y) są marginalne funkcje gęstości prawdopodobieństwa odpowiednio X i Y. Ogólnie rzecz biorąc, wyższa wzajemne informacje między zmienną zależną (lub etykietą) i niezależną zmienną (lub funkcją) oznacza, że etykieta ma wyższą wzajemne zależności od tej funkcji. Utrzymuje on najważniejsze miejsca w funkcjach wyjściowych z największymi wzajemnymi informacjami o etykiecie.

Na przykład w przypadku poniższej kolumny Funkcje i etykieta, jeśli określimy, że chcemy, aby 2 pierwsze miejsca (elementy wektorowe), które mają wyższą korelację z kolumną etykiety, dane wyjściowe zastosowania tego narzędzia do szacowania zachowałyby tylko pierwsze i trzecie miejsca, ponieważ ich wartości są bardziej skorelowane z wartościami w kolumnie Etykieta.

Etykieta Funkcje
Prawda 4,6,0
Fałsz 0,7,5
Prawda 4,7,0
Fałsz 0,7,0

W ten sposób powyższy zestaw danych będzie wyglądał, po dopasowaniu narzędzia do szacowania i przekształceniu danych za pomocą wynikowego transformatora:

Etykieta Funkcje
Prawda 4,0
Fałsz 0,5
Prawda 4,0
Fałsz 0,0

Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.

Metody

Fit(IDataView)

Trenuje i zwraca wartość ITransformer.

GetOutputSchema(SchemaShape)

SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku.

Metody rozszerzania

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Dołącz punkt kontrolny buforowania do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane względem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejmą wiele danych.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który wywoła delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólną ITransformerwartość . Jednak w tym samym czasie IEstimator<TTransformer> często są tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania za pośrednictwem EstimatorChain<TLastTransformer> miejsca, w którym narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania.

Dotyczy

Zobacz też