Bagikan melalui


WordEmbeddingEstimator Kelas

Definisi

Featurizer teks yang mengonversi vektor token teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Warisan
WordEmbeddingEstimator
Penerapan

Keterangan

Karakteristik Estimator

Apakah estimator ini perlu melihat data untuk melatih parameternya? Tidak
Jenis data kolom input Vektor Teks
Jenis data kolom output Vektor berukuran dikenal dari Single
Dapat diekspor ke ONNX Tidak

WordEmbeddingTransformer menghasilkan kolom baru, bernama seperti yang ditentukan dalam parameter nama kolom output, di mana setiap vektor input dipetakan ke vektor numerik dengan ukuran 3 * dimensi model penyematan yang digunakan. Perhatikan bahwa ini tidak tergantung pada ukuran vektor input.

Misalnya, saat menggunakan GloVe50D, yang sendiri adalah 50 dimensi, kolom output adalah vektor berukuran 150. Sepertiga slot pertama berisi nilai minimum di seluruh penyematan yang sesuai dengan setiap string di vektor input. Ketiga kedua berisi rata-rata penyematan. Sepertiga slot terakhir berisi nilai maksimum penyematan yang ditemui. Min/maks menyediakan hyper-rectangle pembatas untuk kata-kata dalam ruang penyematan kata. Ini dapat membantu frasa yang lebih panjang di mana rata-rata banyak kata menenggelamkan sinyal yang berguna.

Pengguna dapat menentukan model penyematan kustom yang telah dilatih sebelumnya atau salah satu model yang telah dilatih sebelumnya yang tersedia. Opsi yang tersedia adalah berbagai versi GloVe Models, FastText, dan SSWE.

Periksa bagian Lihat Juga untuk tautan ke contoh penggunaan.

Metode

Fit(IDataView)

Melatih dan mengembalikan WordEmbeddingTransformer.

GetOutputSchema(SchemaShape)

Mengembalikan SchemaShape skema yang akan diproduksi oleh transformator. Digunakan untuk penyebaran dan verifikasi skema dalam alur.

Metode Ekstensi

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tambahkan 'titik pemeriksaan penembolokan' ke rantai estimator. Ini akan memastikan bahwa estimator hilir akan dilatih terhadap data cache. Sangat membantu untuk memiliki titik pemeriksaan penembolokan sebelum pelatih yang mengambil beberapa data berlalu.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Mengingat estimator, kembalikan objek pembungkus yang akan memanggil delegasi setelah Fit(IDataView) dipanggil. Seringkali penting bagi estimator untuk mengembalikan informasi tentang apa yang cocok, itulah sebabnya Fit(IDataView) metode mengembalikan objek yang di ketik secara khusus, bukan hanya umum ITransformer. Namun, pada saat yang sama, IEstimator<TTransformer> sering dibentuk menjadi alur dengan banyak objek, jadi kita mungkin perlu membangun rantai estimator melalui EstimatorChain<TLastTransformer> di mana estimator yang ingin kita dapatkan transformator dimakamkan di suatu tempat dalam rantai ini. Untuk skenario itu, kita dapat melalui metode ini melampirkan delegasi yang akan dipanggil setelah fit dipanggil.

Berlaku untuk

Lihat juga