OneHotHashEncodingEstimator Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Konwertuje co najmniej jedną kolumnę wejściową wartości kategorii na tyle kolumn wyjściowych wektorów zakodowanych na podstawie skrótu.
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- Dziedziczenie
-
OneHotHashEncodingEstimator
- Implementuje
Uwagi
Charakterystyka narzędzia do szacowania
Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? | Tak |
Typ danych kolumny wejściowej | Skalarny lub wektor liczbowy, logiczny, tekst lub typ klucza . |
Typ danych kolumny wyjściowej | Skalarny lub wektor klucza lub wektor typu Single . |
Możliwość eksportowania do ONNX | Nie |
Wynikowa OneHotEncodingTransformer formuła konwertuje co najmniej jedną kolumnę wejściową na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco, gdzie indeksowanie odbywa się przez utworzenie skrótu wartości i użycie skrótu jako indeksu.
Element OneHotEncodingEstimator jest często używany do konwertowania danych kategorialnych na formularz, który można dostarczyć do algorytmu uczenia maszynowego.
Dane wyjściowe tej transformacji są określane przez :OneHotEncodingEstimator.OutputKind
Indicator tworzy wektor wskaźnika. Każde miejsce w tym wektorze odpowiada kategorii w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Jeśli wartość nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.
Bag tworzy jeden wektor, tak aby każde gniazdo przechowywało liczbę wystąpień odpowiedniej wartości w wektorze wejściowym. Każde miejsce w tym wektorze odpowiada wartości w słowniku, więc jego długość jest rozmiarem wbudowanego słownika. Indicator i Bag różnią się po prostu sposobem, w jaki wektory bitowe generowane z poszczególnych miejsc w kolumnie wejściowej są agregowane: dla wskaźnika są łączone i dla worka są dodawane. Gdy kolumna źródłowa jest wartością skalarną, opcje Wskaźnik i Torba są identyczne.
Key tworzy klucze w kolumnie KeyDataViewType . Jeśli kolumna wejściowa jest wektorem, dane wyjściowe zawierają typ klucza wektora, gdzie każde miejsce wektora odpowiada odpowiedniemu miejscu wektora wejściowego. Jeśli kategoria nie zostanie znaleziona w słowniku wbudowanym, zostanie przypisana wartość zero.
Binary tworzy binarny wektor zakodowany w celu reprezentowania wartości znalezionych w słowniku, które znajdują się w kolumnie wejściowej. Jeśli wartość w kolumnie wejściowej nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.
Element OneHotEncodingTransformer można zastosować do co najmniej jednej kolumny. W takim przypadku kompiluje i używa oddzielnego słownika dla każdej zastosowanej kolumny.
Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.
Metody
Fit(IDataView) |
Trenuje i zwraca wartość OneHotHashEncodingTransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku. |
Metody rozszerzania
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Dołącz "punkt kontrolny buforowania" do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane pod kątem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejdą wiele danych. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który będzie wywoływać delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólny ITransformerelement . Jednak w tym samym czasie IEstimator<TTransformer> są często tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania, za pośrednictwem EstimatorChain<TLastTransformer> którego narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania. |