Bagikan melalui


NormalizingEstimator Kelas

Definisi

public sealed class NormalizingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.NormalizingTransformer>
type NormalizingEstimator = class
    interface IEstimator<NormalizingTransformer>
Public NotInheritable Class NormalizingEstimator
Implements IEstimator(Of NormalizingTransformer)
Warisan
NormalizingEstimator
Penerapan

Keterangan

Karakteristik Estimator

Apakah estimator ini perlu melihat data untuk melatih parameternya? Ya
Jenis data kolom input Single atau Double vektor berukuran dikenal dari jenis tersebut.
Jenis data kolom output Jenis data yang sama dengan kolom input
Dapat diekspor ke ONNX Ya

NormalizingEstimator yang dihasilkan akan menormalkan data dengan salah satu cara berikut berdasarkan cara pembuatannya:

  • Min Max - Penskalaan ulang linier yang didasarkan pada nilai minimum dan maksimum untuk setiap baris.
  • Rata-rata Varians - Skala ulang setiap baris ke varians unit dan, secara opsional, rata-rata nol.
  • Varians Rata-Rata Log - Menskalakan ulang setiap baris ke varians unit, secara opsional, rata-rata nol berdasarkan komputasi dalam skala log.
  • Binning - Merumuskan data di setiap baris dan melakukan penskalakan ulang linier berdasarkan bin terhitung.
  • Binning yang Diawasi - Bucketisasi data di setiap baris dan lakukan penskalakan ulang linier berdasarkan bin terhitung. Perhitungan bin didasarkan pada korelasi kolom Label.
  • Penskalaan yang Kuat - Secara opsional berpusat pada data dan skala berdasarkan rentang data dan nilai min dan maks kuantil yang disediakan. Metode ini lebih kuat untuk outlier.

Detail Estimator

Interval data yang dinormalisasi tergantung pada apakah fixZero ditentukan atau tidak. fixZero default ke true. Ketika fixZero salah, interval yang dinormalisasi adalah $[0,1]$ dan distribusi nilai yang dinormalisasi tergantung pada mode normalisasi. Misalnya, dengan Min Max, nilai minimum dan maksimum dipetakan ke 0 dan 1 masing-masing dan nilai yang tersisa berada di antaranya. Ketika fixZero diatur, interval yang dinormalisasi adalah $[-1,1]$ dengan distribusi nilai yang dinormalisasi tergantung pada mode normalisasi, tetapi perilakunya berbeda. Dengan Min Max, distribusi tergantung pada seberapa jauh angkanya dari 0, menghasilkan angka dengan jarak terbesar yang dipetakan ke 1 jika angka positif atau -1 jika angka negatif. Jarak dari 0 akan mempengaruhi distribusi dengan sebagian besar angka yang lebih dekat bersama-sama menormalkan menuju 0. Penskalan yang Kuat tidak menggunakan fixZero, dan nilainya tidak dibatasi ke $[0,1]$ atau $[-1,1]$. Penskalaannya didasarkan pada rentang data dan kuantil min dan maks yang disediakan.

Persamaan untuk output $y$ penerapan Varians Rata-rata dan Varians Rata-Rata Log pada input $x$ tanpa menggunakan opsi CDF adalah: $y = (x - \text{offset}) \text{scale}$. Di mana offset dan skala dihitung selama pelatihan.

Menggunakan opsi CDF adalah: $y = 0,5 * (1 + \text{ERF}((x - \text{mean}) / (\text{standard deviation} * sqrt(2)))$. Di mana ERF adalah Fungsi Kesalahan yang digunakan untuk memperkirakan CDF dari variabel acak yang diasumsikan secara normal didistribusikan. Rata-rata dan simpang siur standar adalah komputasi selama pelatihan.

Untuk membuat estimator ini, gunakan salah satu hal berikut ini:

Periksa tautan di atas untuk contoh penggunaan.

Metode

Fit(IDataView)

Melatih dan mengembalikan NormalizingTransformer.

GetOutputSchema(SchemaShape)

Mengembalikan SchemaShape skema yang akan diproduksi oleh transformator. Digunakan untuk propagasi dan verifikasi skema dalam alur.

Metode Ekstensi

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tambahkan 'titik pemeriksaan penembolokan' ke rantai estimator. Ini akan memastikan bahwa estimator hilir akan dilatih terhadap data cache. Sangat membantu untuk memiliki titik pemeriksaan penembolokan sebelum pelatih yang mengambil beberapa data berlalu.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Mengingat estimator, kembalikan objek pembungkus yang akan memanggil delegasi setelah Fit(IDataView) dipanggil. Seringkali penting bagi estimator untuk mengembalikan informasi tentang apa yang cocok, itulah sebabnya Fit(IDataView) metode mengembalikan objek yang ditik secara khusus, bukan hanya umum ITransformer. Namun, pada saat yang sama, IEstimator<TTransformer> sering dibentuk menjadi alur dengan banyak objek, jadi kita mungkin perlu membangun rantai estimator melalui EstimatorChain<TLastTransformer> tempat estimator yang ingin kita dapatkan transformator dikubur di suatu tempat dalam rantai ini. Untuk skenario itu, kita dapat melalui metode ini melampirkan delegasi yang akan dipanggil setelah pas dipanggil.

Berlaku untuk