Udostępnij za pośrednictwem


OneHotHashEncodingEstimator Klasa

Definicja

Konwertuje co najmniej jedną kolumnę wejściową wartości kategorii na tyle kolumn wyjściowych wektorów zakodowanych na podstawie skrótu.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Dziedziczenie
OneHotHashEncodingEstimator
Implementuje

Uwagi

Charakterystyka narzędzia do szacowania

Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? Tak
Typ danych kolumny wejściowej Skalarny lub wektor liczbowy, logiczny, tekst lub typ klucza .
Typ danych kolumny wyjściowej Skalarny lub wektor klucza lub wektor typu Single .
Możliwość eksportowania do ONNX Nie

Wynikowa OneHotEncodingTransformer formuła konwertuje co najmniej jedną kolumnę wejściową na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco, gdzie indeksowanie odbywa się przez utworzenie skrótu wartości i użycie skrótu jako indeksu.

Element OneHotEncodingEstimator jest często używany do konwertowania danych kategorialnych na formularz, który można dostarczyć do algorytmu uczenia maszynowego.

Dane wyjściowe tej transformacji są określane przez :OneHotEncodingEstimator.OutputKind

  • Indicator tworzy wektor wskaźnika. Każde miejsce w tym wektorze odpowiada kategorii w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Jeśli wartość nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.

  • Bag tworzy jeden wektor, tak aby każde gniazdo przechowywało liczbę wystąpień odpowiedniej wartości w wektorze wejściowym. Każde miejsce w tym wektorze odpowiada wartości w słowniku, więc jego długość jest rozmiarem wbudowanego słownika. Indicator i Bag różnią się po prostu sposobem, w jaki wektory bitowe generowane z poszczególnych miejsc w kolumnie wejściowej są agregowane: dla wskaźnika są łączone i dla worka są dodawane. Gdy kolumna źródłowa jest wartością skalarną, opcje Wskaźnik i Torba są identyczne.

  • Key tworzy klucze w kolumnie KeyDataViewType . Jeśli kolumna wejściowa jest wektorem, dane wyjściowe zawierają typ klucza wektora, gdzie każde miejsce wektora odpowiada odpowiedniemu miejscu wektora wejściowego. Jeśli kategoria nie zostanie znaleziona w słowniku wbudowanym, zostanie przypisana wartość zero.

  • Binary tworzy binarny wektor zakodowany w celu reprezentowania wartości znalezionych w słowniku, które znajdują się w kolumnie wejściowej. Jeśli wartość w kolumnie wejściowej nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.

Element OneHotEncodingTransformer można zastosować do co najmniej jednej kolumny. W takim przypadku kompiluje i używa oddzielnego słownika dla każdej zastosowanej kolumny.

Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.

Metody

Fit(IDataView)

Trenuje i zwraca wartość OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku.

Metody rozszerzania

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Dołącz "punkt kontrolny buforowania" do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane pod kątem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejdą wiele danych.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który będzie wywoływać delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólny ITransformerelement . Jednak w tym samym czasie IEstimator<TTransformer> są często tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania, za pośrednictwem EstimatorChain<TLastTransformer> którego narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania.

Dotyczy

Zobacz też