Udostępnij za pośrednictwem


WordEmbeddingEstimator Klasa

Definicja

Cecha tekstowa, która konwertuje wektory tokenów tekstowych na wektor liczbowy przy użyciu wstępnie wytrenowanego modelu osadzania.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Dziedziczenie
WordEmbeddingEstimator
Implementuje

Uwagi

Charakterystyka narzędzia do szacowania

Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? Nie
Typ danych kolumny wejściowej Wektor tekstu
Typ danych kolumny wyjściowej Znany wektor wielkości Single
Możliwość eksportowania do ONNX Nie

Tworzy WordEmbeddingTransformer nową kolumnę o nazwie określonej w parametrach nazwy kolumny wyjściowej, gdzie każdy wektor wejściowy jest mapowany na wektor liczbowy o rozmiarze 3 * wymiarowości używanego modelu osadzania. Zwróć uwagę, że jest to niezależne od rozmiaru wektora wejściowego.

Na przykład w przypadku korzystania z funkcji GloVe50D, która sama jest 50-wymiarowa, kolumna wyjściowa jest wektorem o rozmiarze 150. Pierwsza trzecia miejsc zawiera minimalne wartości we wszystkich osadzach odpowiadających każdemu ciągowi w wektorze wejściowym. Druga trzecia zawiera średnią osadzeń. Ostatnia trzecia miejsc zawiera maksymalne wartości napotkanych osadzeń. Wartość minimalna/maksymalna zapewnia hiperkąt ograniczenia wyrazów w obszarze osadzania wyrazów. Może to pomóc w dłuższych frazach, w których średnia wielu słów zagłusza przydatny sygnał.

Użytkownik może określić niestandardowy wstępnie wytrenowany model osadzania lub jeden z dostępnych wstępnie wytrenowanych modeli. Dostępne opcje to różne wersje modeli GloVe, FastText i SSWE.

Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.

Metody

Fit(IDataView)

Trenuje i zwraca wartość WordEmbeddingTransformer.

GetOutputSchema(SchemaShape)

SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku.

Metody rozszerzania

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Dołącz "punkt kontrolny buforowania" do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane pod kątem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejdą wiele danych.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który będzie wywoływać delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólny ITransformerelement . Jednak w tym samym czasie IEstimator<TTransformer> są często tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania, za pośrednictwem EstimatorChain<TLastTransformer> którego narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania.

Dotyczy

Zobacz też