SupportedTransformers Kelas
Menentukan nama yang berinteraksi dengan pelanggan untuk transformator yang didukung oleh AutoML.
Transformator diklasifikasikan untuk digunakan dengan Categorical data (misalnya, CatImputer
), data DateTime (misalnya, DataTimeTransformer
), data Text (misalnya, TfIdf
), atau untuk jenis data Generic (misalnya, Imputer
).
- Warisan
-
builtins.objectSupportedTransformers
Konstruktor
SupportedTransformers()
Keterangan
Atribut yang ditentukan dalam SupportedTransformers digunakan dalam ringkasan model featurization saat menggunakan pra-pemrosesan otomatis dalam Azure Machine Learning otomatis atau saat menyesuaikan metode fiturisasi dengan kelas FeaturizationConfig seperti yang ditunjukkan pada contoh.
featurization_config = FeaturizationConfig()
featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})
Untuk informasi selengkapnya, lihat Mengonfigurasi eksperimen Pembelajaran Mesin otomatis dengan Python.
Atribut
ImputationMarker
Tambahkan penanda imputasi boolean untuk nilai yang diperhitungkan.
ImputationMarker = 'ImputationMarker'
Imputer
Lengkapi nilai yang hilang.
Imputer = 'Imputer'
MaxAbsScaler
Skalakan data menggunakan nilai absolut maksimumnya.
MaxAbsScaler = 'MaxAbsScaler'
CatImputer
Perhitungkan nilai yang hilang untuk data kategoris menurut kategori yang paling sering.
CatImputer = 'CatImputer'
HashOneHotEncoder
Ubah input ke hash dan kodekan ke vektor yang dikodekan one hot.
HashOneHotEncoder = 'HashOneHotEncoder'
LabelEncoder
Kodekan data kategoris dalam angka.
LabelEncoder = 'LabelEncoder'
CatTargetEncoder
Petakan data kategori dengan nilai target rata-rata untuk regresi serta probabilitas kelas untuk klasifikasi.
CatTargetEncoder = 'CatTargetEncoder'
WoETargetEncoder
Hitung Berat dari Bukti korelasi data kategoris ke kolom target.
WoETargetEncoder = 'WoETargetEncoder'
OneHotEncoder
Ubah input menjadi vektor yang dikodekan one hot.
OneHotEncoder = 'OneHotEncoder'
DateTimeTransformer
Perluas fitur datatime ke sub fitur seperti tahun, bulan, dan juga hari.
DateTimeTransformer = 'DateTimeTransformer'
CountVectorizer
Ubah kumpulan dokumen menjadi matriks jumlah token.
CountVectorizer = 'CountVectorizer'
NaiveBayes
Ubah data tekstual dengan menggunakan sklearn Multinomial Naïve Bayes.
NaiveBayes = 'NaiveBayes'
StringCast
Transmisikan input ke string dan huruf kecil jika diperlukan.
StringCast = 'StringCast'
TextTargetEncoder
Terapkan pengkodean target ke data teks di mana model linier bertumpuk dengan bag-of-words menghasilkan kemungkinan setiap kelas.
TextTargetEncoder = 'TextTargetEncoder'
TfIdf
Ubah matriks hitungan menjadi representasi TF atau TF-iDF yang dinormalisasi.
TfIdf = 'TfIdf'
TimeIndexFeaturizer
Transformator untuk membuat fitur berbasis tanggalwaktu menggunakan time_index_featurizer kelas .
TimeIndexFeaturizer = 'TimeIndexFeaturizer'
WordEmbedding
Ubah vektor token teks menjadi vektor kalimat dengan menggunakan model yang sudah dilatih.
WordEmbedding = 'WordEmbedding'
CUSTOMIZABLE_TRANSFORMERS
Transformator yang disesuaikan dalam metode featurization dengan parameter metode di kelas FeaturizationConfig.
CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}
BLOCK_TRANSFORMERS
Transformer yang dapat diblokir dari penggunaan dalam metode featurization di kelas FeaturizationConfig.
BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
FULL_SET
Set lengkap dari transformator.
FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk