Aracılığıyla paylaş


Kategorik Değerleri Grupla

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Birden çok kategorideki verileri yeni bir kategoriye gruplar

Kategori: Veri Dönüştürme / Düzenleme

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, yerinde arama tablosu oluşturmak için Machine Learning Studio'daki (klasik) Kategorik Değerleri Grupla modülünün nasıl kullanımı açıklanmıştır.

Kategorik değerleri gruplamanın tipik kullanımı, birden çok dize değerlerini tek bir yeni düzeyde birleştirmektir. Örneğin, bir bölgedeki posta kodlarını tek bir bölgesel koda ataabilir veya birden çok ürünü tek bir kategori altında gruplandırabilirsiniz.

Bu modülü kullanmak için kullanmak istediğiniz arama değerlerini yazın ve var olan değerleri değiştirme değerleriyle eşlersiniz. Gruplamaları yalnızca kategorik sütunlar için oluşturabilirsiniz; sayısal türde sütunlar veya etiketler veya özellik olarak belirlenen sütunlar için oluşturmazsınız.

Açıkça yeni bir düzeye eşlenmemiş tüm sütun değerleri varsayılan bir düzeye atanır. Örneğin, tek tek posta kodlarının hepsini eşlemezsiniz, eşlenmemiş değerler için bir düzeyde gruplandırabilirsiniz. Bu düzey Bilinmiyor olarak da anabilirsiniz.

Not

Varsayılan düzey de dahil olmak üzere en fazla 20 yeni düzey oluşturulabilir. Daha fazla değere ihtiyacınız varsa veya eşlemeleri dinamik olarak tanımlamanız gerekirse, R Betiği Yürütme modülünde özel R betiği kullanmanızı öneririz. Veya SQL Dönüştürmeyi Uygula modülünde SQL deyimlerini kullanın.

Grup Kategorik Değerlerini kullanma

Mevcut değerlerin ve yeni kategorilerin listesini önceden hazırlamanız önerilir. Her kategori için yeni bir kategori adı ve kategoriye dahil etmek için virgülle ayrılmış bir değer listesi hazırlamanız gerekir.

  1. Kategorik Değerleri Grupla modülünü denemenize ekleyin. Modülü Veri Dönüştürme, İşleme altındabulabilirsiniz.

  2. Bağlan dönüştürmek istediğiniz değerlere sahip bir veri kümesi içerir.

  3. Kategorik Değerleri Grupla'nın Özellikler bölmesinde, azaltmak istediğiniz düzeylere sahip sütunu seçmek için Sütun Seçici'yi kullanın.

    • Başlamak için BEGIN WITH veNO COLUMNS 'a tıklamayı ve ardından sütunları adla eklemenizi öneririz. Aksi takdirde aday olarak çok fazla sütun eklenebilir ve bu da hataya neden olabilir.

    • Sütunun kategorik bir sütun olması gerekir. Yoksa Meta Verileri Düzenle yukarı akışı ekleyin ve sütun türünü değiştirme.

    • Dize değiştirmenin uygulanmay olduğu sütunları girişten kaldırabilirsiniz.

  4. Çıkış modu için yalnızca yeni düzeylerin çıkışını almak mı yoksa özgün sütunu görmek için değişiklikleri eklemek mi istediğinizi ve değiştirmeleri yan yana görmek isteyip istemeyebilirsiniz?

    Varsayılan ResultOnly değeri yalnızca yeni değerleri gösterir. Inplace seçeneği, mevcut sütun değerlerini yeni düzeylerle değiştirir.

  5. Varsayılan düzey adı için, açıkça eşlenmemiş tüm değerlerin yerini alan bir dize değeri yazın. "Bilinmeyen" veya "Varsayılan" gibi bir şey kullanabilirsiniz.

    Not

    Bu varsayılan düzey değeri, eşlenmemiş tüm değerlere uygulanır. Yanlışlıkla eşlemeyi niyetli olmadığınız sütunları dahil edersiniz, bu değer sütunlarda yer alan tüm değerlere uygulanır. Bu nedenle, işlemeden önce sütun seçiminin doğru olup olduğunu kontrol edin.

  6. Yeni düzey sayısı için, eşlenmemiş değerler için varsayılan düzey de dahil olmak üzere yeni kategorilerin (düzeylerin) toplam sayısını gösteren bir sayı yazın.

  7. Yeni düzey 1'in Adı için ilk kategori için yeni grup adını girin.

  8. Hemen ardından gelen metin kutusuna, yeni düzey 1'e eşlemek için eski düzeylerin virgülle ayrılmış listesi, yeni düzeye eşlensin tüm değerlerin kapsamlı bir listesini yazın veya yapıştırın. Joker karakterlere ve normal ifadelere izin verilmez.

  9. Yeni düzey adları yazın ve yeni düzeye eşlenmiş olması gereken değerleri yazın veya yapıştırın.

    Çalışırken değer listenizi ayrı bir dosyaya kaydetmenizi öneririz. Düzey sayısını değiştirirsanız, daha önce yazarak tüm dizeler kaldırılır ve baştan başlamanız gerekir.

    Ancak, daha önce kaydedilmiş bir modülü düzenliyorsanız özgün ayarlara geri dönebilirsiniz.

  10. Denemeyi çalıştırın.

Sonuçlar

Sonuçları görüntülemek için Kategorik Değerleri Grupla modülüne sağ tıklayın , Sonuçlar veri kümesi'ne tıklayın ve Görselleştir'e tıklayın.

Örnekler

Makine öğrenmesi uygulamalı örnekleri için bkz . Azure Yapay Zeka Galerisi.

Bu modülü, Machine Learning Studio'da (klasik) sağlanan Automobile price veri kümesi gibi kolayca gruplandırabilir dize değişkenleriyle küçük bir veri kümesi kullanarak kendiniz de sınabilirsiniz.

Otomobil fiyat veri kümesinde silindir sayısını kullanarak otomobilleri motor boyutuna göre gruplayabilirsiniz. Çok sayıda farklı altyapı boyutu yerine yeni "büyük", "küçük" ve "diğer" düzeyleri aşağıdaki gibi oluşturabilirsiniz:

  • Büyük motor: altı silindir veya daha büyük
  • Küçük altyapılar: iki veya dört silindir
  • Diğer: diğer her şey
  1. Veri Kümesinde Sütunları Seçme modülünü ekleyin ve yalnızca sütunu num-of-cylinders seçin.
  2. Meta Verileri Düzenle modülünü ekleyin ve sütunu num-of-cylinders Kategorik olarak değiştirme.
  3. Kategorik Değerleri Grupla modülünü ekleyin ve değiştirilen veri kümesine bağlanabilirsiniz.
  4. Varsayılan düzey adı için yazın other. Bu düzey için değer sağlamanız gerekli değil.
  5. Yeni düzey 1'in Adı için yazın big. Düzey 1'e eşlen eski düzeyler listesine yapıştırın six, eight, twelve.
  6. Yeni düzey 2'nin Adı için yazın small. Eşlenen değerler için yapıştırın two, four.
  7. Denemeyi çalıştırın.
  8. Sonuçları görselleştirin , özgün veri kümesine ve gibi hesaba sahip olmadığınız bazı garip altyapı boyutları olduğunu fark ettiysiniz fivethree. Bu tür tüm öğeler düzeye eşlenmiş other .

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

  • "Columnname" adlı sütun izin verilen< bir kategoride değil>" hata iletisiyle karşılaşabilirsiniz.

    Bu ileti, seçtiğiniz sütunun kategorik bir sütun olmadığını gösterir. Meta Verileri Düzenle'yi kullanarak Categorical sütunu olarak işaretleyemez veya uygun kategori değerlerini içeren farklı bir sütun seçin.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri Tablosu Grup için veriler

Modül parametreleri

Name Aralık Tür Varsayılan Description
Seçili sütunlar herhangi biri ColumnSelection CategoricalAll Grup olacak sütunları seçin.
Çıkış modu herhangi biri OutputTo ResultOnly Kategori etiketlerinin çıkışını belirtin.
Varsayılan düzey adı herhangi biri Dize Eşleme eşleşmezse, varsayılan düzeyi kullanın.
Yeni düzey sayısı Liste Grup sayısı Varsayılan düzey dahil olmak üzere, değerler gruplandıktan sonra düzeylerin sayısını belirtin.

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri Tablosu Grup verileri

Ayrıca bkz.

Manipülasyon
Veri Dönüştürme
A-Z Modül Listesi