Karar Ormanı Regresyonu bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Karar ağaçları topluluğuna dayalı bir regresyon modeli oluşturmak için bu bileşeni kullanın.

Modeli yapılandırdıktan sonra etiketli bir veri kümesi ve Modeli Eğit bileşeni kullanarak modeli eğitmelisiniz. Eğitilen model daha sonra tahminlerde bulunmak için kullanılabilir.

Nasıl çalışır?

Karar ağaçları, yaprak düğüme (karar) ulaşılana kadar ikili ağaç veri yapısından geçen her örnek için bir dizi basit test gerçekleştiren parametrik olmayan modellerdir.

Karar ağaçlarının şu avantajları vardır:

  • Eğitim ve tahmin sırasında hem hesaplama hem de bellek kullanımı açısından verimlidirler.

  • Doğrusal olmayan karar sınırlarını temsil edebilir.

  • Tümleşik özellik seçimi ve sınıflandırması gerçekleştirirler ve gürültülü özelliklerin varlığında dayanıklıdırlar.

Bu regresyon modeli, karar ağaçlarının bir topluluğundan oluşur. Regresyon karar ormanındaki her ağaç, tahmin olarak bir Gauss dağılımı oluşturur. Modeldeki tüm ağaçlar için birleşik dağılıma en yakın Gauss dağılımını bulmak için ağaç topluluğu üzerinde bir toplama gerçekleştirilir.

Bu algoritmanın teorik çerçevesi ve uygulaması hakkında daha fazla bilgi için şu makaleye bakın: Karar Ormanları: Sınıflandırma, Regresyon, Yoğunluk Tahmini, Manifold Öğrenmesi ve Semi-Supervised Öğrenme için Birleşik Bir Çerçeve

Karar Ormanı Regresyon Modelini yapılandırma

  1. Karar Ormanı Regresyonu bileşenini işlem hattına ekleyin. Bileşeni tasarımcıda Machine Learning, Initialize Model ve Regression altında bulabilirsiniz.

  2. Bileşen özelliklerini açın ve Yeniden Örnekleme yöntemi için tek tek ağaçları oluşturmak için kullanılan yöntemi seçin. Paketleme veya Çoğaltma arasından seçim yapabilirsiniz.

    • Paketleme: Paketleme, bootstrap toplama olarak da adlandırılır. Regresyon karar ormanındaki her ağaç, tahmin yoluyla bir Gauss dağılımı oluşturur. Toplama, ilk iki anı, tek tek ağaçların döndürdiği tüm dağılımları birleştirerek verilen Gauss dağılımının karışımı anlarıyla eşleşen bir Gaussian bulmaktır.

      Daha fazla bilgi için bkz. Bootstrap toplama için Wikipedia girdisi.

    • Çoğaltma: Çoğaltmada, her ağaç tam olarak aynı giriş verileri üzerinde eğitilir. Her ağaç düğümü için hangi bölme koşulunun kullanıldığının belirlenmesi rastgele kalır ve ağaçlar farklı olacaktır.

      Çoğalt seçeneğiyle eğitim süreci hakkında daha fazla bilgi için bkz. Görüntü İşleme için Karar Ormanları ve Tıbbi Görüntü Analizi. Criminisi ve J. Shotton. Springer 2013...

  3. Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitileceğini belirtin.

    • Tek Parametre

      Modeli nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz. Bu değerleri deneme yaparak öğrenmiş veya kılavuz olarak almış olabilirsiniz.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve parametre süpürme işlemi çalıştırmak istiyorsanız bu seçeneği belirleyin. Yinelemek için bir değer aralığı seçin; Ayarlama Modeli Hiper Parametreleri , en iyi sonuçları oluşturan hiper parametreleri belirlemek için sağladığınız ayarların tüm olası birleşimleri üzerinde yinelenir.

  4. Karar ağacı sayısı için, toplulukta oluşturulacak toplam karar ağacı sayısını belirtin. Daha fazla karar ağacı oluşturarak daha iyi kapsama alanı elde edebilirsiniz, ancak eğitim süresi artar.

    İpucu

    Değeri 1 olarak ayarlarsanız; ancak bu, yalnızca bir ağacın (ilk parametre kümesini içeren ağaç) üretileceği ve başka yineleme yapılmayacağı anlamına gelir.

  5. Karar ağaçlarının maksimum derinliği için, herhangi bir karar ağacının maksimum derinliğini sınırlamak için bir sayı yazın. Ağacın derinliğinin artırılması, fazla uygunluk ve eğitim süresinin artması riskiyle duyarlılığı artırabilir.

  6. Düğüm başına rastgele bölme sayısı için, ağacın her bir düğümünü oluştururken kullanılacak bölme sayısını yazın. Bölme, her ağaç düzeyindeki (düğüm) özelliklerin rastgele bölündüğü anlamına gelir.

  7. Yaprak düğüm başına en az örnek sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az servis talebi sayısını belirtin.

    Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız. Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız eğitim verilerinin aynı koşullara uyan en az beş durum içermesi gerekir.

  8. Modeli eğitin:

    Not

    Modeli Eğitmek için bir parametre aralığı geçirirseniz, tek parametre listesindeki yalnızca varsayılan değeri kullanır.

    Model Ayarlama Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir dizi ayar beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile belirttiğiniz tek değer süpürme boyunca kullanılır.

  9. İşlem hattını gönderin.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Eğitilen modelin anlık görüntüsünü kaydetmek için eğitim bileşenini seçin ve sağ panelde Çıkışlar sekmesine geçin. Modeli kaydet simgesine tıklayın. Kaydedilen modeli bileşen ağacında bileşen olarak bulabilirsiniz.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.