Kategorik Değerleri Grupla
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Birden çok kategorideki verileri yeni bir kategoriye gruplar
Kategori: Veri Dönüştürme / Düzenleme
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle genel bakış
Bu makalede, yerinde arama tablosu oluşturmak için Machine Learning Studio'daki (klasik) Kategorik Değerleri Grupla modülünün nasıl kullanımı açıklanmıştır.
Kategorik değerleri gruplamanın tipik kullanımı, birden çok dize değerlerini tek bir yeni düzeyde birleştirmektir. Örneğin, bir bölgedeki posta kodlarını tek bir bölgesel koda ataabilir veya birden çok ürünü tek bir kategori altında gruplandırabilirsiniz.
Bu modülü kullanmak için kullanmak istediğiniz arama değerlerini yazın ve var olan değerleri değiştirme değerleriyle eşlersiniz. Gruplamaları yalnızca kategorik sütunlar için oluşturabilirsiniz; sayısal türde sütunlar veya etiketler veya özellik olarak belirlenen sütunlar için oluşturmazsınız.
Açıkça yeni bir düzeye eşlenmemiş tüm sütun değerleri varsayılan bir düzeye atanır. Örneğin, tek tek posta kodlarının hepsini eşlemezsiniz, eşlenmemiş değerler için bir düzeyde gruplandırabilirsiniz. Bu düzey Bilinmiyor olarak da anabilirsiniz.
Not
Varsayılan düzey de dahil olmak üzere en fazla 20 yeni düzey oluşturulabilir. Daha fazla değere ihtiyacınız varsa veya eşlemeleri dinamik olarak tanımlamanız gerekirse, R Betiği Yürütme modülünde özel R betiği kullanmanızı öneririz. Veya SQL Dönüştürmeyi Uygula modülünde SQL deyimlerini kullanın.
Grup Kategorik Değerlerini kullanma
Mevcut değerlerin ve yeni kategorilerin listesini önceden hazırlamanız önerilir. Her kategori için yeni bir kategori adı ve kategoriye dahil etmek için virgülle ayrılmış bir değer listesi hazırlamanız gerekir.
Kategorik Değerleri Grupla modülünü denemenize ekleyin. Modülü Veri Dönüştürme, İşleme altındabulabilirsiniz.
Bağlan dönüştürmek istediğiniz değerlere sahip bir veri kümesi içerir.
Kategorik Değerleri Grupla'nın Özellikler bölmesinde, azaltmak istediğiniz düzeylere sahip sütunu seçmek için Sütun Seçici'yi kullanın.
Başlamak için BEGIN WITH veNO COLUMNS 'a tıklamayı ve ardından sütunları adla eklemenizi öneririz. Aksi takdirde aday olarak çok fazla sütun eklenebilir ve bu da hataya neden olabilir.
Sütunun kategorik bir sütun olması gerekir. Yoksa Meta Verileri Düzenle yukarı akışı ekleyin ve sütun türünü değiştirme.
Dize değiştirmenin uygulanmay olduğu sütunları girişten kaldırabilirsiniz.
Çıkış modu için yalnızca yeni düzeylerin çıkışını almak mı yoksa özgün sütunu görmek için değişiklikleri eklemek mi istediğinizi ve değiştirmeleri yan yana görmek isteyip istemeyebilirsiniz?
Varsayılan ResultOnly değeri yalnızca yeni değerleri gösterir. Inplace seçeneği, mevcut sütun değerlerini yeni düzeylerle değiştirir.
Varsayılan düzey adı için, açıkça eşlenmemiş tüm değerlerin yerini alan bir dize değeri yazın. "Bilinmeyen" veya "Varsayılan" gibi bir şey kullanabilirsiniz.
Not
Bu varsayılan düzey değeri, eşlenmemiş tüm değerlere uygulanır. Yanlışlıkla eşlemeyi niyetli olmadığınız sütunları dahil edersiniz, bu değer sütunlarda yer alan tüm değerlere uygulanır. Bu nedenle, işlemeden önce sütun seçiminin doğru olup olduğunu kontrol edin.
Yeni düzey sayısı için, eşlenmemiş değerler için varsayılan düzey de dahil olmak üzere yeni kategorilerin (düzeylerin) toplam sayısını gösteren bir sayı yazın.
Yeni düzey 1'in Adı için ilk kategori için yeni grup adını girin.
Hemen ardından gelen metin kutusuna, yeni düzey 1'e eşlemek için eski düzeylerin virgülle ayrılmış listesi, yeni düzeye eşlensin tüm değerlerin kapsamlı bir listesini yazın veya yapıştırın. Joker karakterlere ve normal ifadelere izin verilmez.
Yeni düzey adları yazın ve yeni düzeye eşlenmiş olması gereken değerleri yazın veya yapıştırın.
Çalışırken değer listenizi ayrı bir dosyaya kaydetmenizi öneririz. Düzey sayısını değiştirirsanız, daha önce yazarak tüm dizeler kaldırılır ve baştan başlamanız gerekir.
Ancak, daha önce kaydedilmiş bir modülü düzenliyorsanız özgün ayarlara geri dönebilirsiniz.
Denemeyi çalıştırın.
Sonuçlar
Sonuçları görüntülemek için Kategorik Değerleri Grupla modülüne sağ tıklayın , Sonuçlar veri kümesi'ne tıklayın ve Görselleştir'e tıklayın.
Örnekler
Makine öğrenmesi uygulamalı örnekleri için bkz . Azure Yapay Zeka Galerisi.
Bu modülü, Machine Learning Studio'da (klasik) sağlanan Automobile price veri kümesi gibi kolayca gruplandırabilir dize değişkenleriyle küçük bir veri kümesi kullanarak kendiniz de sınabilirsiniz.
Otomobil fiyat veri kümesinde silindir sayısını kullanarak otomobilleri motor boyutuna göre gruplayabilirsiniz. Çok sayıda farklı altyapı boyutu yerine yeni "büyük", "küçük" ve "diğer" düzeyleri aşağıdaki gibi oluşturabilirsiniz:
- Büyük motor: altı silindir veya daha büyük
- Küçük altyapılar: iki veya dört silindir
- Diğer: diğer her şey
- Veri Kümesinde Sütunları Seçme modülünü ekleyin ve yalnızca sütunu
num-of-cylinders
seçin. - Meta Verileri Düzenle modülünü ekleyin ve sütunu
num-of-cylinders
Kategorik olarak değiştirme. - Kategorik Değerleri Grupla modülünü ekleyin ve değiştirilen veri kümesine bağlanabilirsiniz.
- Varsayılan düzey adı için yazın
other
. Bu düzey için değer sağlamanız gerekli değil. - Yeni düzey 1'in Adı için yazın
big
. Düzey 1'e eşlen eski düzeyler listesine yapıştırınsix, eight, twelve
. - Yeni düzey 2'nin Adı için yazın
small
. Eşlenen değerler için yapıştırıntwo, four
. - Denemeyi çalıştırın.
- Sonuçları görselleştirin , özgün veri kümesine ve gibi hesaba sahip olmadığınız bazı garip altyapı boyutları olduğunu fark ettiysiniz
five
three
. Bu tür tüm öğeler düzeye eşlenmişother
.
Teknik notlar
Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.
"Columnname" adlı sütun izin verilen< bir kategoride değil>" hata iletisiyle karşılaşabilirsiniz.
Bu ileti, seçtiğiniz sütunun kategorik bir sütun olmadığını gösterir. Meta Verileri Düzenle'yi kullanarak
Categorical
sütunu olarak işaretleyemez veya uygun kategori değerlerini içeren farklı bir sütun seçin.
Beklenen girişler
Ad | Tür | Description |
---|---|---|
Veri kümesi | Veri Tablosu | Grup için veriler |
Modül parametreleri
Name | Aralık | Tür | Varsayılan | Description |
---|---|---|---|---|
Seçili sütunlar | herhangi biri | ColumnSelection | CategoricalAll | Grup olacak sütunları seçin. |
Çıkış modu | herhangi biri | OutputTo | ResultOnly | Kategori etiketlerinin çıkışını belirtin. |
Varsayılan düzey adı | herhangi biri | Dize | Eşleme eşleşmezse, varsayılan düzeyi kullanın. | |
Yeni düzey sayısı | Liste | Grup sayısı | Varsayılan düzey dahil olmak üzere, değerler gruplandıktan sonra düzeylerin sayısını belirtin. |
Çıktı
Ad | Tür | Description |
---|---|---|
Sonuç veri kümesi | Veri Tablosu | Grup verileri |