Aracılığıyla paylaş


WordEmbeddingEstimator Sınıf

Tanım

Önceden eğitilmiş bir ekleme modeli kullanarak metin belirteçlerinin vektörlerini sayısal vektöre dönüştüren metin özellik oluşturucu.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Devralma
WordEmbeddingEstimator
Uygulamalar

Açıklamalar

Tahmin Aracı Özellikleri

Bu tahmin aracının parametrelerini eğitmek için verilere bakması gerekiyor mu? No
Giriş sütunu veri türü Metin Vektör
Çıkış sütunu veri türü Bilinen boyutlu vektör Single
ONNX'e aktarılabilir No

, WordEmbeddingTransformer her giriş vektörünün kullanılan ekleme modelinin boyutu 3 * boyuta sahip bir sayısal vektörle eşlendiği çıkış sütunu adı parametrelerinde belirtilen adlı yeni bir sütun oluşturur. Bunun giriş vektörünün boyutundan bağımsız olduğuna dikkat edin.

Örneğin, kendisi 50 boyutlu olan GloVe50D kullanılırken çıkış sütunu 150 boyutunda bir vektördür. Yuvaların ilk üçte biri, giriş vektöründe her dizeye karşılık gelen eklemeler genelinde minimum değerleri içerir. İkinci üçüncü, eklemelerin ortalamasını içerir. Yuvaların son üçte biri, karşılaşılan eklemelerin maksimum değerlerini içerir. min/max, ekleme alanı sözcüğündeki sözcükler için sınırlayıcı bir hiper dikdörtgen sağlar. Bu, birçok sözcüğün ortalamasının yararlı sinyali boğduğu daha uzun ifadeler için yardımcı olabilir.

Kullanıcı, önceden eğitilmiş özel bir ekleme modeli veya kullanılabilir önceden eğitilen modellerden birini belirtebilir. Kullanılabilir seçenekler GloVe Modelleri, FastText ve SSWE'nin çeşitli sürümleridir.

Kullanım örneklerinin bağlantıları için Ayrıca Bkz. bölümüne bakın.

Yöntemler

Fit(IDataView)

Bir WordEmbeddingTransformereğiter ve döndürür.

GetOutputSchema(SchemaShape)

SchemaShape Transformatör tarafından üretilecek şemanın değerini döndürür. İşlem hattında şema yayma ve doğrulama için kullanılır.

Uzantı Metotları

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tahmin aracı zincirine bir 'önbelleğe alma denetim noktası' ekler. Bu, aşağı akış tahmincilerinin önbelleğe alınan verilere karşı eğitilmesini sağlar. Birden çok veri geçişi alan eğitmenlerden önce bir önbelleğe alma denetim noktası olması yararlıdır.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Tahmin aracı verildiğinde, çağrıldıktan sonra Fit(IDataView) temsilci çağıracak bir sarmalama nesnesi döndürün. Tahmin aracının neyin uygun olduğu hakkında bilgi döndürmesi genellikle önemlidir. Bu nedenle Fit(IDataView) yöntem yalnızca genel ITransformerbir nesne yerine özel olarak yazılan bir nesne döndürür. Bununla birlikte, aynı zamanda, IEstimator<TTransformer> genellikle birçok nesneye sahip işlem hatları halinde oluşturulur, bu nedenle transformatör almak istediğimiz tahmin aracının EstimatorChain<TLastTransformer> bu zincirde bir yere gömülü olduğu bir tahmin aracı zinciri oluşturmamız gerekebilir. Bu senaryo için, bu yöntem aracılığıyla sığdır çağrıldıktan sonra çağrılacak bir temsilci ekleyebiliriz.

Şunlara uygulanır

Ayrıca bkz.