Gösterge Değerlerine dönüştürme

Bu makalede Azure Machine Learning tasarımcısının bir bileşeni açıklanmaktadır.

Kategorik değerler içeren sütunları bir dizi ikili gösterge sütununa dönüştürmek için Azure Machine Learning tasarımcısındaki Gösterge Değerlerine Dönüştür bileşenini kullanın.

Gösterge Değerlerine Dönüştür işlemi, kategorik verilerin ikili veya birden çok değerle temsil edilen gösterge değerlerine dönüştürülmesini sağlar. Bu işlem, sınıflandırma modelleri için sıklıkla kullanılan veri ön işleme adımlarından biridir.

Bu bileşen ayrıca gösterge değerlerine dönüştürmek için kullanılan dönüşümün tanımını da verir. Dönüştürme Uygula bileşenini kullanarak bu dönüşümü aynı şemaya sahip diğer veri kümelerinde yeniden kullanabilirsiniz.

Gösterge Değerlerine Dönüştür'ü yapılandırma

  1. Gösterge Değerlerine Dönüştür'ü bulun ve işlem hattı taslağınıza sürükleyin. Bu bileşeni Veri Dönüştürme kategorisi altında bulabilirsiniz.

    Not

    Hedef sütunları kategorik olarak işaretlemek için, Başlatıcı Değerlerine Dönüştür bileşeninden önce Meta Verileri Düzenle bileşenini kullanabilirsiniz.

  2. BağlanGösterge Değerleri bileşenine dönüştürmek istediğiniz sütunları içeren veri kümesine dönüştürün.

  3. Bir veya daha fazla kategorik sütun seçmek için Sütunu düzenle'yi seçin.

  4. Yalnızca yeni Boole sütunlarının çıktısını almak istiyorsanız Kategorik sütunların üzerine yaz seçeneğini belirleyin. Varsayılan olarak, bu değer kapalıdır.

    İpucu

    Üzerine yazma seçeneğini belirlerseniz, kaynak sütun aslında silinmez veya değiştirilmez. Bunun yerine, yeni sütunlar oluşturulur ve çıkış veri kümesinde sunulur ve kaynak sütun çalışma alanında kullanılabilir durumda kalır. Özgün verileri görmeniz gerekiyorsa, kaynak sütunu yeniden eklemek için istediğiniz zaman Sütun Ekle bileşenini kullanabilirsiniz.

  5. İşlem hattını gönderin.

Sonuçlar

Sunucunun yüksek, orta veya düşük hata olasılığına sahip olup olmadığını gösteren puanlara sahip bir sütuna sahip olduğunuzu varsayalım.

Sunucu Kimliği Hata puanı
10301 Düşük
10302 Orta
10303 Yüksek

Gösterge Değerlerine Dönüştür'ü uyguladığınızda tasarımcı tek bir etiket sütununu Boole değerleri içeren birden çok sütuna dönüştürür:

Sunucu Kimliği Hata puanı - Düşük Hata puanı - Orta Hata puanı - Yüksek
10301 1 0 0
10302 0 1 0
10303 0 0 1

Dönüştürme şu şekilde çalışır:

  • Riski açıklayan Hata puanı sütununda yalnızca üç olası değer (Yüksek, Orta ve Düşük) vardır ve eksik değer yoktur. Bu nedenle, tam olarak üç yeni sütun oluşturulur.

  • Yeni gösterge sütunları, kaynak sütunun sütun başlıklarına ve değerlerine göre adlandırılır ve şu desen kullanılır: <kaynak sütun>- <veri değeri>.

  • Her sunucunun tek bir risk derecelendirmesi olabileceğinden, tam olarak bir gösterge sütununda 1 ve diğer tüm gösterge sütunlarında 0 olmalıdır.

Artık üç gösterge sütununu bir makine öğrenmesi modelinde özellik olarak kullanabilirsiniz.

Bileşen iki çıkış döndürür:

  • Sonuç veri kümesi: Gösterge değerleri sütunlarının dönüştürüldüğü bir veri kümesi. Temizleme için seçilmeyen sütunlar da "geçirilir".
  • Gösterge değerleri dönüştürme: Gösterge değerlerine dönüştürmek için kullanılan ve çalışma alanınıza kaydedilebilen ve daha sonra yeni verilere uygulanabilen bir veri dönüştürme.

Kaydedilmiş gösterge değerleri işlemini yeni verilere uygulama

Gösterge değerleri işlemlerini sık sık yinelemeniz gerekiyorsa, veri işleme adımlarınızı dönüşüm olarak kaydederek aynı veri kümesiyle yeniden kullanabilirsiniz. Bu, aynı şemaya sahip verileri sık sık yeniden içeri aktarmanız ve temizlemeniz gerekiyorsa kullanışlıdır.

  1. İşlem hattınıza Dönüştürme Uygula bileşenini ekleyin.

  2. Temizlemek istediğiniz veri kümesini ekleyin ve veri kümesini sağ giriş bağlantı noktasına bağlayın.

  3. Tasarımcının sol tarafındaki bölmede Veri Dönüştürme grubunu genişletin. Kaydedilen dönüşümü bulun ve işlem hattına sürükleyin.

  4. Kaydedilen dönüştürmeyi sol giriş bağlantı noktasına BağlanDönüştürmeYi Uygula.

    Kaydedilmiş bir dönüştürme uyguladığınızda, dönüştürülecek sütunları seçemezsiniz. Bunun nedeni dönüştürmenin tanımlanmış olması ve özgün işlemde belirtilen veri türlerine otomatik olarak geçerli olmasıdır.

  5. İşlem hattını gönderin.

Teknik notlar

Bu bölüm uygulama ayrıntılarını, ipuçlarını ve sık sorulan soruların yanıtlarını içerir.

Kullanım ipuçları

  • Yalnızca kategorik olarak işaretlenmiş sütunlar gösterge sütunlarına dönüştürülebilir. Aşağıdaki hatayı görürseniz, seçtiğiniz sütunlardan biri kategorik olmayabilir:

    Hata 0056: Ad <sütunu adı> olan sütun izin verilen bir kategoride değil.

    Varsayılan olarak, çoğu dize sütunu dize özellikleri olarak işlenir, bu nedenle Meta Verileri Düzenle'yi kullanarak bunları açıkça kategorik olarak işaretlemeniz gerekir.

  • Gösterge sütunlarına dönüştürebileceğiniz sütun sayısı sınırı yoktur. Ancak, her değer sütunu birden çok gösterge sütunu oluşturabileceğinden, bir kerede yalnızca birkaç sütunu dönüştürmek ve gözden geçirmek isteyebilirsiniz.

  • Sütunda eksik değerler varsa, eksik kategori için şu adla ayrı bir gösterge sütunu oluşturulur: <kaynak sütun>- Eksik

  • Gösterge değerlerine dönüştürdüğünüz sütun sayı içeriyorsa, diğer özellik sütunları gibi kategorik olarak işaretlenmeleri gerekir. Bunu yaptıktan sonra sayılar ayrık değerler olarak değerlendirilir. Örneğin, MPG değerleri 25 ile 30 arasında değişen sayısal bir sütuna sahipseniz, her ayrık değer için yeni bir gösterge sütunu oluşturulur:

    Oluşturma Otoyol mpg -25 Otoyol mpg -26 Otoyol mpg -27 Otoyol mpg -28 Otoyol mpg -29 Otoyol mpg -30
    Contoso Cars 0 0 0 0 0 1
  • Veri kümenize çok fazla boyut eklemekten kaçınmak için. Önce sütundaki değerlerin sayısını denetlemenizi ve verileri uygun şekilde bölmenizi veya nicelemenizi öneririz.

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.