Bagikan melalui


OneHotHashEncodingEstimator Kelas

Definisi

Mengonversi satu atau beberapa kolom input dari nilai kategoris menjadi kolom output sebanyak vektor yang dikodekan one-hot berbasis hash.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Warisan
OneHotHashEncodingEstimator
Penerapan

Keterangan

Karakteristik Estimator

Apakah estimator ini perlu melihat data untuk melatih parameternya? Ya
Jenis data kolom input Skalar atau vektor jenis numerik, boolean, teks, atau kunci .
Jenis data kolom output Skalar atau vektor kunci, atau vektor jenis Single .
Dapat diekspor ke ONNX Tidak

Hasilnya OneHotEncodingTransformer mengonversi satu atau beberapa kolom input menjadi kolom output sebanyak vektor yang dikodekan one-hot, di mana pengindeksan dilakukan dengan hashing nilai dan menggunakan hash sebagai indeks.

OneHotEncodingEstimator sering digunakan untuk mengonversi data kategoris menjadi bentuk yang dapat diberikan ke algoritma pembelajaran mesin.

Output dari transformasi ini ditentukan oleh OneHotEncodingEstimator.OutputKind:

  • Indicator menghasilkan vektor indikator. Setiap slot dalam vektor ini sesuai dengan kategori dalam kamus, sehingga panjangnya adalah ukuran kamus bawaan. Jika nilai tidak ditemukan dalam kamus, outputnya adalah vektor nol.

  • Bag menghasilkan satu vektor sehingga setiap slot menyimpan jumlah kemunculan nilai yang sesuai dalam vektor input. Setiap slot dalam vektor ini sesuai dengan nilai dalam kamus, sehingga panjangnya adalah ukuran kamus yang dibangun. Indicator dan Bag berbeda hanya dalam bagaimana bit-vektor yang dihasilkan dari slot individu di kolom input diagregasi: untuk Indikator mereka digabungkan dan untuk Tas mereka ditambahkan. Ketika kolom sumber adalah Skalar, opsi Indikator dan Tas identik.

  • Key menghasilkan kunci dalam KeyDataViewType kolom. Jika kolom input adalah vektor, output berisi jenis kunci vektor, di mana setiap slot vektor sesuai dengan masing-masing slot vektor input. Jika kategori tidak ditemukan dalam kamus bawaan, kategori akan diberi nilai nol.

  • Binary menghasilkan vektor yang dikodekan biner untuk mewakili nilai yang ditemukan dalam kamus yang ada di kolom input. Jika nilai dalam kolom input tidak ditemukan dalam kamus, outputnya adalah vektor nol.

OneHotEncodingTransformer dapat diterapkan ke satu atau beberapa kolom, dalam hal ini membangun dan menggunakan kamus terpisah untuk setiap kolom tempat kolom diterapkan.

Periksa bagian Lihat Juga untuk tautan ke contoh penggunaan.

Metode

Fit(IDataView)

Melatih dan mengembalikan OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

Mengembalikan SchemaShape skema yang akan diproduksi oleh transformator. Digunakan untuk propagasi dan verifikasi skema dalam alur.

Metode Ekstensi

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tambahkan 'titik pemeriksaan penembolokan' ke rantai estimator. Ini akan memastikan bahwa estimator hilir akan dilatih terhadap data cache. Sangat membantu untuk memiliki titik pemeriksaan penembolokan sebelum pelatih yang mengambil beberapa data berlalu.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Mengingat estimator, kembalikan objek pembungkus yang akan memanggil delegasi setelah Fit(IDataView) dipanggil. Seringkali penting bagi estimator untuk mengembalikan informasi tentang apa yang cocok, itulah sebabnya Fit(IDataView) metode mengembalikan objek yang ditik secara khusus, bukan hanya umum ITransformer. Namun, pada saat yang sama, IEstimator<TTransformer> sering dibentuk menjadi alur dengan banyak objek, jadi kita mungkin perlu membangun rantai estimator melalui EstimatorChain<TLastTransformer> tempat estimator yang ingin kita dapatkan transformator dikubur di suatu tempat dalam rantai ini. Untuk skenario itu, kita dapat melalui metode ini melampirkan delegasi yang akan dipanggil setelah pas dipanggil.

Berlaku untuk

Lihat juga