Çok Sınıflı Karar Ormanı bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Karar ormanı algoritmasını temel alan bir makine öğrenmesi modeli oluşturmak için bu bileşeni kullanın. Karar ormanı, etiketli verilerden öğrenirken hızlı bir şekilde bir dizi karar ağacı oluşturan bir grup modelidir.

Karar ormanları hakkında daha fazla bilgi

Karar ormanı algoritması, sınıflandırma için bir grup öğrenme yöntemidir. Algoritma, birden çok karar ağacı oluşturup en popüler çıkış sınıfına oy vererek çalışır. Oylama, bir sınıflandırma karar ormanındaki her ağacın normalleştirilmemiş bir sıklık histogramı çıkardığı bir toplama biçimidir. Toplama işlemi bu histogramları toplayarak her etiket için "olasılıkları" almak üzere sonucu normalleştirir. Yüksek tahmin güveni olan ağaçlar, topluluğun son kararında daha fazla ağırlığa sahiptir.

Genel olarak karar ağaçları parametrik olmayan modellerdir, başka bir deyişle çeşitli dağılımlara sahip verileri desteklerler. Her ağaçta, her sınıf için bir dizi basit test çalıştırılır ve yaprak düğüme (karar) ulaşılana kadar ağaç yapısının düzeyleri artırılır.

Karar ağaçlarının birçok avantajı vardır:

  • Doğrusal olmayan karar sınırlarını temsil edebilir.
  • Bunlar, eğitim ve tahmin sırasında hesaplama ve bellek kullanımı açısından verimlidir.
  • Tümleşik özellik seçimi ve sınıflandırması gerçekleştirir.
  • Gürültülü özelliklerin varlığında dayanıklıdırlar.

Azure Machine Learning'deki karar ormanı sınıflandırıcısı, karar ağaçlarından oluşan bir topluluktan oluşur. Genel olarak, grup modelleri tek karar ağaçlarından daha iyi kapsama ve doğruluk sağlar. Daha fazla bilgi için bkz. Karar ağaçları.

Çok Sınıflı Karar Ormanı'nın yapılandırılması

  1. Çok Sınıflı Karar Ormanı bileşenini tasarımcıdaki işlem hattınıza ekleyin. Bu bileşeni Machine Learning, Initialize Model ve Classification altında bulabilirsiniz.

  2. Özellikler bölmesini açmak için bileşene çift tıklayın.

  3. Yeniden Örnekleme yöntemi için tek tek ağaçları oluşturmak için kullanılan yöntemi seçin. Paketleme veya çoğaltma arasından seçim yapabilirsiniz.

    • Paketleme: Paketleme, bootstrap toplama olarak da adlandırılır. Bu yöntemde her ağaç, özgün veri kümesinin boyutuna göre bir veri kümesine sahip olana kadar özgün veri kümesini rastgele örneklemek suretiyle oluşturulan yeni bir örnekte büyütülür. Modellerin çıkışları, bir toplama biçimi olan oylama ile birleştirilir. Daha fazla bilgi için bkz. Bootstrap toplama için Wikipedia girdisi.

    • Çoğaltma: Çoğaltmada, her ağaç tam olarak aynı giriş verileri üzerinde eğitilir. Her ağaç düğümü için hangi bölünmüş koşulun kullanıldığının belirlenmesi rastgele kalır ve farklı ağaçlar oluşturur.

  4. Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitileceğini belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız ve bağımsız değişken olarak bir değer kümesi sağlamak istiyorsanız bu seçeneği belirleyin.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve parametre süpürme işlemi çalıştırmak istiyorsanız bu seçeneği belirleyin. Yinelemek için bir değer aralığı seçin; Ayarlama Modeli Hiper Parametreleri , en iyi sonuçları oluşturan hiper parametreleri belirlemek için sağladığınız ayarların tüm olası birleşimleri üzerinde yinelenir.

  5. Karar ağacı sayısı: Grup içinde oluşturulabilecek en fazla karar ağacı sayısını yazın. Daha fazla karar ağacı oluşturarak daha iyi kapsama alanı elde edebilirsiniz, ancak eğitim süresi artabilir.

    Değeri 1 olarak ayarlarsanız; ancak bu, yalnızca bir ağacın (ilk parametre kümesini içeren ağaç) üretilebileceği ve başka yineleme yapılmayacağı anlamına gelir.

  6. Karar ağaçlarının maksimum derinliği: Herhangi bir karar ağacının maksimum derinliğini sınırlamak için bir sayı yazın. Ağacın derinliğinin artırılması, fazla uygunluk ve eğitim süresinin artması riskiyle duyarlılığı artırabilir.

  7. Düğüm başına rastgele bölme sayısı: Ağacın her bir düğümünü oluştururken kullanılacak bölme sayısını yazın. Bölme, her ağaç düzeyindeki (düğüm) özelliklerin rastgele bölündüğü anlamına gelir.

  8. Yaprak düğüm başına en az örnek sayısı: Ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az servis talebi sayısını belirtin. Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız.

    Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız eğitim verilerinin aynı koşullara uyan en az beş durum içermesi gerekir.

  9. Etiketli bir veri kümesini bağlayın ve modeli eğitin:

    Not

    Modeli Eğitmek için bir parametre aralığı geçirirseniz, tek parametre listesindeki yalnızca varsayılan değeri kullanır.

    Model Ayarlama Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir dizi ayar beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile belirttiğiniz tek değer süpürme boyunca kullanılır.

  10. İşlem hattını gönderin.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.