Veri dönüştürmeleri şunlar için kullanılır:
- Model eğitimi için verileri hazırlama.
- İçeri aktarılan modeli TensorFlow veya ONNX biçiminde uygulayın.
- İşlem sonrası veriler bir modelden geçirildikten sonra.
Bu kılavuzdaki dönüştürmeler, IEstimator arabirimini uygulayan sınıfları döndürür. Veri dönüştürmeleri birbirine zincirlenebilir. Her dönüştürme, bağlı başvuru belgelerinde belirtilen belirli tür ve biçimlerdeki verileri bekler ve üretir.
Bazı veri dönüştürmeleri, parametrelerini hesaplamak için eğitim verilerini gerektirir. Örneğin: NormalizeMeanVariance transformatör, işlem sırasında Fit() eğitim verilerinin ortalamasını ve varyansını hesaplar ve bu parametreleri işlemde Transform() kullanır.
Diğer veri dönüştürmeleri için eğitim verileri gerekmez. Örneğin: ConvertToGrayscale dönüşümü, Transform() işlemini Fit() işlemi sırasında herhangi bir eğitim verisi görmeden gerçekleştirebilir.
Sütun eşleme ve gruplandırma
| Dönüşüm |
Tanım |
ONNX Export Edilebilir |
| Concatenate |
Bir veya daha fazla giriş sütununu yeni bir çıkış sütununa birleştirme |
Evet |
| CopyColumns |
Bir veya daha fazla giriş sütunlarını kopyalama ve yeniden adlandırma |
Evet |
| DropColumns |
Bir veya daha fazla giriş sütununu kaldır |
Evet |
| SelectColumns |
Giriş verilerinden saklamak için bir veya daha fazla sütun seçin |
Evet |
Normalleştirme ve ölçeklendirme
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| NormalizeMeanVariance |
Eğitim verilerinin ortalamasını çıkarın ve eğitim verilerinin varyansına bölün. |
Evet |
| NormalizeLogMeanVariance |
Eğitim verilerinin logaritması temelinde normalleştirme |
Evet |
| NormalizeLpNorm |
Giriş vektörlerini lp normlarına göre ölçeklendirin; burada p 1, 2 veya sonsuzdur. Varsayılan olarak l2 (Öklid uzaklığı) normunu kullanır |
Evet |
| NormalizeGlobalContrast |
Her satırdaki her değeri, satır verilerinin ortalamasını çıkararak ve ardından satır verilerinin standart sapmasına veya l2 normuna bölerek ölçeklendirin, ardından yapılandırılabilir bir ölçek faktörüyle (varsayılan 2) çarpın. |
Evet |
| NormalizeBinning |
Giriş değerini bir bin dizinine atayın ve 0 ile 1 arasında bir kayan noktalı değer üretmek için bin sayısına bölün. Bölme sınırları, eğitim verilerini bölmeler arasında eşit olarak dağıtmak için hesaplanır |
Evet |
| NormalizeSupervisedBinning |
Giriş değerini etiket sütunuyla bağıntısına göre bir kutuya atayın. |
Evet |
| NormalizeMinMax |
Eğitim verilerindeki minimum ve maksimum değerler arasındaki farka göre girişi ölçeklendirin |
Evet |
| NormalizeRobustScaling |
Verileri 0 civarında ortalayacak ve verileri nicelik aralığına göre ölçeklendirecek aykırı değerlere dayanıklı istatistikler kullanarak her değeri ölçeklendirin. |
Evet |
Veri türleri arasındaki dönüştürmeler
| Dönüşüm |
Tanım |
ONNX Aktarılabilir |
| ConvertType |
Giriş sütununun türünü yeni bir türe dönüştürme |
Evet |
| MapValue |
Sağlanan eşleme sözlüğüne göre değerleri anahtarlara (kategoriler) eşleme |
Hayır |
| MapValueToKey |
Giriş verilerinden eşlemeyi oluşturarak değerleri anahtarlara (kategoriler) eşleyin |
Evet |
| MapKeyToValue |
Anahtarları özgün değerlerine dönüştürme |
Evet |
| MapKeyToVector |
Anahtarları özgün değerlerin vektörlerine geri dönüştürme |
Evet |
| MapKeyToBinaryVector |
Anahtarları, özgün değerlerin bir ikili vektörüne geri dönüştürme |
Hayır |
| Hash |
Giriş sütunundaki değeri hashleme |
Evet |
Metin dönüştürmeleri
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| FeaturizeText |
Metin sütununu normalleştirilmiş ngram ve char-gram sayılarından oluşan float dizisine dönüştürme |
Hayır |
| TokenizeIntoWords |
Bir veya daha fazla metin sütunlarını tek tek sözcüklere bölme |
Evet |
| TokenizeIntoCharactersAsKeys |
Bir veya daha fazla metin sütununu tek tek karakterlere bölün ve bunları bir konu kümesi üzerinde dalgalandırın. |
Evet |
| NormalizeText |
Büyük/küçük harf değiştirme, aksan işaretlerini, noktalama işaretlerini ve sayıları kaldırma |
Evet |
| ProduceNgrams |
Metin sütununu ngram sayısı (ardışık sözcük dizileri) içeren bir torbaya dönüştürme |
Evet |
| ProduceWordBags |
Metin sütununu ngram sayısı vektörü bir torbaya dönüştürme |
Evet |
| ProduceHashedNgrams |
Metin sütununu karma ngram sayılarından oluşan bir vektöre dönüştürme |
Hayır |
| ProduceHashedWordBags |
Metin sütununu karma ngram sayılarından oluşan bir torbaya dönüştürme |
Evet |
| RemoveDefaultStopWords |
Belirtilen dil için varsayılan durdurma sözcüklerini giriş sütunlarından kaldırma |
Evet |
| RemoveStopWords |
Belirtilen durdurma sözcüklerini giriş sütunlarından kaldırır |
Evet |
| LatentDirichletAllocation |
Bir belgeyi (ondalık sayıların vektörü olarak temsil edilir) bir konu kümesi üzerinden ondalık sayıların vektörü haline dönüştürmek |
Evet |
| ApplyWordEmbedding |
Önceden eğitilmiş bir model kullanarak metin belirteçlerinin vektörlerini cümle vektörlerine dönüştürme |
Evet |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| OneHotEncoding |
Bir veya daha fazla metin sütunlarını tek sık kodlanmış vektörlere dönüştürme |
Evet |
| OneHotHashEncoding |
Bir veya daha fazla metin sütununu karma tabanlı tek-seçenekli kodlanmış vektörlere dönüştürme. |
Hayır |
| Dönüşüm |
Tanım |
ONNX ile dışa aktarılabilir |
| DetectAnomalyBySrCnn |
Spektral Artık (SR) algoritmasını kullanarak zaman serisi giriş verilerindeki anomalileri algıla |
Hayır |
| DetectChangePointBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerindeki değişiklik noktalarını algılama |
Hayır |
| DetectIidChangePoint |
Uyarlamalı çekirdek yoğunluğu tahminlerini ve martingale puanlarını kullanarak bağımsız ve özdeş dağıtılmış (IID) zaman serisi verilerindeki değişiklik noktalarını algılama |
Hayır |
| ForecastBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerini tahmin edin |
Hayır |
| DetectSpikeBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerindeki ani artışları algılama |
Hayır |
| DetectIidSpike |
Uyarlamalı çekirdek yoğunluğu tahminlerini ve martingale puanlarını kullanarak bağımsız ve özdeş dağıtılmış (IID) zaman serisi verilerindeki ani artışları algılama |
Hayır |
| DetectEntireAnomalyBySrCnn |
SRCNN algoritmasını kullanarak giriş verilerinin tamamı için anomalileri algılama. |
Hayır |
| DetectSeasonality |
Fourier analizini kullanarak mevsimselliği algılama. |
Hayır |
| LocalizeRootCause |
Bir karar ağacı algoritması kullanarak zaman serisi girişinden kök nedeni yerelleştirir. |
Hayır |
| LocalizeRootCauses |
Bağlama serisi girişinden kök nedenleri yerelleştirir. |
Hayır |
Eksik değerler
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| IndicateMissingValues |
Giriş sütunundaki değer eksik olduğunda değeri true olan yeni bir boole çıkış sütunu oluşturun |
Evet |
| ReplaceMissingValues |
Değeri giriş sütununda eksikse varsayılan değere ayarlanmış olan yeni bir çıkış sütunu ve aksi takdirde giriş değeri oluşturun |
Evet |
Özellik seçimi
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| ApproximatedKernelMap |
Her giriş vektörlerini daha düşük boyutlu bir özellik alanına eşleyin; burada iç ürünler yaklaşık bir çekirdek işlevine sahiptir, böylece özellikler doğrusal algoritmalara giriş olarak kullanılabilir |
Hayır |
| ProjectToPrincipalComponents |
Ana Bileşen Analizi algoritmasını uygulayarak giriş özelliği vektörünün boyutlarını azaltın |
|
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| Platt(String, String, String) |
Eğitim verileri kullanılarak tahmin edilen parametrelerle lojistik regresyon kullanarak ikili sınıflandırıcı ham puanını sınıf olasılığına dönüştürür |
Evet |
| Platt(Double, Double, String) |
Sabit parametrelerle lojistik regresyon kullanarak ikili sınıflandırıcı ham puanını sınıf olasılığına dönüştürür |
Evet |
| Naive |
İkili sınıflandırıcı ham puanını, bölmelere puan atayarak ve bölmeler arasındaki dağılıma göre olasılığı hesaplayarak sınıf olasılığına dönüştürür |
Evet |
| Isotonic |
İkili sınıflandırıcı ham puanını, sınırların konumunun ve bölmelerin boyutunun eğitim verileri kullanılarak tahmin edildiği bölmelere puanlar atayarak sınıf olasılığına dönüştürür |
Hayır |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| ApplyOnnxModel |
İçeri aktarılan ONNX modeliyle giriş verilerini dönüştürme |
Hayır |
| LoadTensorFlowModel |
İçeri aktarılan TensorFlow modeliyle giriş verilerini dönüştürme |
Hayır |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| FilterByCustomPredicate |
Belirtilen koşulun doğru döndürdüğü satırları siler. |
Hayır |
| FilterByStatefulCustomPredicate |
Belirtilen koşulun true döndürdüğü satırları bırakır, ancak belirtilen duruma izin verir. |
Hayır |
| CustomMapping |
Kullanıcı tanımlı eşlemeyle mevcut sütunları yeni sütunlara dönüştürme |
Hayır |
| Expression |
Bir ifade uygulayarak sütunları yeni sütunlara dönüştürün |
Hayır |