Veri dönüştürmeleri şunlar için kullanılır:
- Model eğitimi için verileri hazırlama.
- İçeri aktarılan modeli TensorFlow veya ONNX biçiminde uygulayın.
- İşlem sonrası veriler bir modelden geçirildikten sonra.
Bu kılavuzdaki dönüştürmeler, IEstimator arabirimini uygulayan sınıfları döndürür. Veri dönüştürmeleri birbirine zincirlenebilir. Her dönüştürme, bağlı başvuru belgelerinde belirtilen belirli tür ve biçimlerdeki verileri bekler ve üretir.
Bazı veri dönüştürmeleri, parametrelerini hesaplamak için eğitim verilerini gerektirir. Örneğin: NormalizeMeanVariance transformatör, işlem sırasında Fit() eğitim verilerinin ortalamasını ve varyansını hesaplar ve bu parametreleri işlemde Transform() kullanır.
Diğer veri dönüştürmeleri için eğitim verileri gerekmez. Örneğin: dönüştürme işlemi ConvertToGrayscale sırasında Transform()Fit() herhangi bir eğitim verisi görmeden gerçekleştirebilir.
Sütun eşleme ve gruplandırma
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| Concatenate |
Bir veya daha fazla giriş sütununu yeni bir çıkış sütununa birleştirme |
Evet |
| CopyColumns |
Bir veya daha fazla giriş sütunlarını kopyalama ve yeniden adlandırma |
Evet |
| DropColumns |
Bir veya daha fazla giriş sütunu bırakma |
Evet |
| SelectColumns |
Giriş verilerinden saklamak için bir veya daha fazla sütun seçin |
Evet |
Normalleştirme ve ölçeklendirme
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| NormalizeMeanVariance |
Ortalamayı (eğitim verilerinin) çıkarma ve varyansa (eğitim verilerinin) bölünmesi |
Evet |
| NormalizeLogMeanVariance |
Eğitim verilerinin logaritması temelinde normalleştirme |
Evet |
| NormalizeLpNorm |
Giriş vektörlerini lp normlarına göre ölçeklendirin; burada p 1, 2 veya sonsuzdur. Varsayılan olarak l2 (Öklid uzaklığı) normunu kullanır |
Evet |
| NormalizeGlobalContrast |
Satır verilerinin ortalamasını çıkararak ve standart sapmaya veya l2 norma (satır verilerinin) bölünmesini sağlayarak satırdaki her değeri ölçeklendirin ve yapılandırılabilir bir ölçek faktörüyle çarpın (varsayılan 2) |
Evet |
| NormalizeBinning |
Giriş değerini bir bölme dizinine atayın ve 0 ile 1 arasında bir kayan değer üretmek için bölme sayısına bölün. Bölme sınırları, eğitim verilerini bölmeler arasında eşit olarak dağıtmak için hesaplanır |
Evet |
| NormalizeSupervisedBinning |
Giriş değerini etiket sütunuyla bağıntısına göre bir bölmeye atama |
Evet |
| NormalizeMinMax |
Eğitim verilerindeki minimum ve maksimum değerler arasındaki farka göre girişi ölçeklendirin |
Evet |
| NormalizeRobustScaling |
Verileri 0 civarında ortalayacak ve verileri nicelik aralığına göre ölçeklendirecek aykırı değerlere dayanıklı istatistikler kullanarak her değeri ölçeklendirin. |
Evet |
Veri türleri arasındaki dönüştürmeler
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| ConvertType |
Giriş sütununun türünü yeni bir türe dönüştürme |
Evet |
| MapValue |
Sağlanan eşleme sözlüğüne göre değerleri anahtarlara (kategoriler) eşleme |
Hayır |
| MapValueToKey |
Giriş verilerinden eşlemeyi oluşturarak değerleri anahtarlara (kategoriler) eşleyin |
Evet |
| MapKeyToValue |
Anahtarları özgün değerlerine dönüştürme |
Evet |
| MapKeyToVector |
Anahtarları özgün değerlerin vektörlerine dönüştürme |
Evet |
| MapKeyToBinaryVector |
Anahtarları özgün değerlerin ikili vektörlerine dönüştürme |
Hayır |
| Hash |
Giriş sütunundaki değeri karma olarak oluşturma |
Evet |
Metin dönüştürmeleri
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| FeaturizeText |
Metin sütununu normalleştirilmiş ngram ve char-gram sayılarından oluşan float dizisine dönüştürme |
Hayır |
| TokenizeIntoWords |
Bir veya daha fazla metin sütunlarını tek tek sözcüklere bölme |
Evet |
| TokenizeIntoCharactersAsKeys |
Bir veya daha fazla metin sütununun tek tek karakterlere bölünmesi, bir konu kümesi üzerinde kayan |
Evet |
| NormalizeText |
Büyük/küçük harf değiştirme, aksan işaretlerini, noktalama işaretlerini ve sayıları kaldırma |
Evet |
| ProduceNgrams |
Metin sütununu ngram sayısı (ardışık sözcük dizileri) içeren bir torbaya dönüştürme |
Evet |
| ProduceWordBags |
Metin sütununu ngram sayısı vektörü bir torbaya dönüştürme |
Evet |
| ProduceHashedNgrams |
Metin sütununu karma ngram sayılarından oluşan bir vektöre dönüştürme |
Hayır |
| ProduceHashedWordBags |
Metin sütununu karma ngram sayılarından oluşan bir torbaya dönüştürme |
Evet |
| RemoveDefaultStopWords |
Belirtilen dil için varsayılan durdurma sözcüklerini giriş sütunlarından kaldırma |
Evet |
| RemoveStopWords |
Belirtilen durdurma sözcüklerini giriş sütunlarından kaldırır |
Evet |
| LatentDirichletAllocation |
Bir belgeyi (kayanların vektörü olarak temsil edilir) bir konu kümesi üzerinde kayanlar vektörü haline dönüştürme |
Evet |
| ApplyWordEmbedding |
Önceden eğitilmiş bir model kullanarak metin belirteçlerinin vektörlerini cümle vektörlerine dönüştürme |
Evet |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| OneHotEncoding |
Bir veya daha fazla metin sütunlarını tek sık kodlanmış vektörlere dönüştürme |
Evet |
| OneHotHashEncoding |
Bir veya daha fazla metin sütunlarını karma tabanlı bir sık erişimli kodlanmış vektöre dönüştürme |
Hayır |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| DetectAnomalyBySrCnn |
Spektral Artık (SR) algoritmasını kullanarak giriş zamanı serisi verilerindeki anomalileri algılama |
Hayır |
| DetectChangePointBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerindeki değişiklik noktalarını algılama |
Hayır |
| DetectIidChangePoint |
Uyarlamalı çekirdek yoğunluğu tahminlerini ve martingale puanlarını kullanarak bağımsız ve özdeş dağıtılmış (IID) zaman serisi verilerindeki değişiklik noktalarını algılama |
Hayır |
| ForecastBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerini tahmin edin |
Hayır |
| DetectSpikeBySsa |
Tekil spektrum analizi (SSA) kullanarak zaman serisi verilerindeki ani artışları algılama |
Hayır |
| DetectIidSpike |
Uyarlamalı çekirdek yoğunluğu tahminlerini ve martingale puanlarını kullanarak bağımsız ve özdeş dağıtılmış (IID) zaman serisi verilerindeki ani artışları algılama |
Hayır |
| DetectEntireAnomalyBySrCnn |
SRCNN algoritmasını kullanarak giriş verilerinin tamamı için anomalileri algılama. |
Hayır |
| DetectSeasonality |
Fourier analizini kullanarak mevsimselliği algılama. |
Hayır |
| LocalizeRootCause |
Bir karar ağacı algoritması kullanarak zaman serisi girişinden kök nedeni yerelleştirir. |
Hayır |
| LocalizeRootCauses |
Bağlama serisi girişinden kök nedenleri yerelleştirir. |
Hayır |
Eksik değerler
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| IndicateMissingValues |
Giriş sütunundaki değer eksik olduğunda değeri true olan yeni bir boole çıkış sütunu oluşturun |
Evet |
| ReplaceMissingValues |
Değeri giriş sütununda eksikse varsayılan değere ayarlanmış olan yeni bir çıkış sütunu ve aksi takdirde giriş değeri oluşturun |
Evet |
Özellik seçimi
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| ApproximatedKernelMap |
Her giriş vektörlerini daha düşük boyutlu bir özellik alanına eşleyin; burada iç ürünler yaklaşık bir çekirdek işlevine sahiptir, böylece özellikler doğrusal algoritmalara giriş olarak kullanılabilir |
Hayır |
| ProjectToPrincipalComponents |
Ana Bileşen Analizi algoritmasını uygulayarak giriş özelliği vektörünün boyutlarını azaltın |
|
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| Platt(String, String, String) |
Eğitim verileri kullanılarak tahmin edilen parametrelerle lojistik regresyon kullanarak ikili sınıflandırıcı ham puanını sınıf olasılığına dönüştürür |
Evet |
| Platt(Double, Double, String) |
Sabit parametrelerle lojistik regresyon kullanarak ikili sınıflandırıcı ham puanını sınıf olasılığına dönüştürür |
Evet |
| Naive |
İkili sınıflandırıcı ham puanını, bölmelere puan atayarak ve bölmeler arasındaki dağılıma göre olasılığı hesaplayarak sınıf olasılığına dönüştürür |
Evet |
| Isotonic |
İkili sınıflandırıcı ham puanını, sınırların konumunun ve bölmelerin boyutunun eğitim verileri kullanılarak tahmin edildiği bölmelere puanlar atayarak sınıf olasılığına dönüştürür |
Hayır |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| ApplyOnnxModel |
İçeri aktarılan ONNX modeliyle giriş verilerini dönüştürme |
Hayır |
| LoadTensorFlowModel |
İçeri aktarılan TensorFlow modeliyle giriş verilerini dönüştürme |
Hayır |
| Dönüşüm |
Tanım |
ONNX Dışarı Aktarılabilir |
| FilterByCustomPredicate |
Belirtilen koşulun true döndürdüğü satırları bırakır. |
Hayır |
| FilterByStatefulCustomPredicate |
Belirtilen koşulun true döndürdüğü satırları bırakır, ancak belirtilen duruma izin verir. |
Hayır |
| CustomMapping |
Kullanıcı tanımlı eşlemeyle mevcut sütunları yeni sütunlara dönüştürme |
Hayır |
| Expression |
Sütunları yeni sütunlara dönüştürmek için ifade uygulama |
Hayır |