Bagikan melalui


SupportedTransformers Kelas

Menentukan nama yang berinteraksi dengan pelanggan untuk transformator yang didukung oleh AutoML.

Transformator diklasifikasikan untuk digunakan dengan Categorical data (misalnya, CatImputer), data DateTime (misalnya, DataTimeTransformer), data Text (misalnya, TfIdf), atau untuk jenis data Generic (misalnya, Imputer).

Warisan
builtins.object
SupportedTransformers

Konstruktor

SupportedTransformers()

Keterangan

Atribut yang ditentukan dalam SupportedTransformers digunakan dalam ringkasan model featurization saat menggunakan pra-pemrosesan otomatis dalam Azure Machine Learning otomatis atau saat menyesuaikan metode fiturisasi dengan kelas FeaturizationConfig seperti yang ditunjukkan pada contoh.


   featurization_config = FeaturizationConfig()
   featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
   featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})

Untuk informasi selengkapnya, lihat Mengonfigurasi eksperimen Pembelajaran Mesin otomatis dengan Python.

Atribut

ImputationMarker

Tambahkan penanda imputasi boolean untuk nilai yang diperhitungkan.

ImputationMarker = 'ImputationMarker'

Imputer

Lengkapi nilai yang hilang.

Imputer = 'Imputer'

MaxAbsScaler

Skalakan data menggunakan nilai absolut maksimumnya.

MaxAbsScaler = 'MaxAbsScaler'

CatImputer

Perhitungkan nilai yang hilang untuk data kategoris menurut kategori yang paling sering.

CatImputer = 'CatImputer'

HashOneHotEncoder

Ubah input ke hash dan kodekan ke vektor yang dikodekan one hot.

HashOneHotEncoder = 'HashOneHotEncoder'

LabelEncoder

Kodekan data kategoris dalam angka.

LabelEncoder = 'LabelEncoder'

CatTargetEncoder

Petakan data kategori dengan nilai target rata-rata untuk regresi serta probabilitas kelas untuk klasifikasi.

CatTargetEncoder = 'CatTargetEncoder'

WoETargetEncoder

Hitung Berat dari Bukti korelasi data kategoris ke kolom target.

WoETargetEncoder = 'WoETargetEncoder'

OneHotEncoder

Ubah input menjadi vektor yang dikodekan one hot.

OneHotEncoder = 'OneHotEncoder'

DateTimeTransformer

Perluas fitur datatime ke sub fitur seperti tahun, bulan, dan juga hari.

DateTimeTransformer = 'DateTimeTransformer'

CountVectorizer

Ubah kumpulan dokumen menjadi matriks jumlah token.

CountVectorizer = 'CountVectorizer'

NaiveBayes

Ubah data tekstual dengan menggunakan sklearn Multinomial Naïve Bayes.

NaiveBayes = 'NaiveBayes'

StringCast

Transmisikan input ke string dan huruf kecil jika diperlukan.

StringCast = 'StringCast'

TextTargetEncoder

Terapkan pengkodean target ke data teks di mana model linier bertumpuk dengan bag-of-words menghasilkan kemungkinan setiap kelas.

TextTargetEncoder = 'TextTargetEncoder'

TfIdf

Ubah matriks hitungan menjadi representasi TF atau TF-iDF yang dinormalisasi.

TfIdf = 'TfIdf'

TimeIndexFeaturizer

Transformator untuk membuat fitur berbasis tanggalwaktu menggunakan time_index_featurizer kelas .

TimeIndexFeaturizer = 'TimeIndexFeaturizer'

WordEmbedding

Ubah vektor token teks menjadi vektor kalimat dengan menggunakan model yang sudah dilatih.

WordEmbedding = 'WordEmbedding'

CUSTOMIZABLE_TRANSFORMERS

Transformator yang disesuaikan dalam metode featurization dengan parameter metode di kelas FeaturizationConfig.

CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}

BLOCK_TRANSFORMERS

Transformer yang dapat diblokir dari penggunaan dalam metode featurization di kelas FeaturizationConfig.

BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}

FULL_SET

Set lengkap dari transformator.

FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}