Artırılmış Karar Ağacı Regresyonu bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Yükseltme kullanarak regresyon ağaçlarından oluşan bir grup oluşturmak için bu bileşeni kullanın. Yükseltme, her ağacın önceki ağaçlara bağımlı olduğu anlamına gelir. Algoritma, kendisinden önceki ağaçların artıklarını sığdırarak öğrenir. Bu nedenle, bir karar ağacı topluluğunda artırmak, daha az kapsama riski olan küçük bir riskle doğruluğu artırma eğilimindedir.

Bu bileşen LightGBM algoritmasını temel alır.

Bu regresyon yöntemi denetimli bir öğrenme yöntemidir ve bu nedenle etiketli bir veri kümesi gerektirir. Etiket sütunu sayısal değerler içermelidir.

Not

Bu bileşeni yalnızca sayısal değişkenler kullanan veri kümeleriyle kullanın.

Modeli tanımladıktan sonra Modeli Eğit komutunu kullanarak eğitin.

Artırılmış regresyon ağaçları hakkında daha fazla bilgi

Yükseltme, paketleme, rastgele ormanlar vb. ile birlikte topluluk modelleri oluşturmaya yönelik çeşitli klasik yöntemlerden biridir. Azure Machine Learning'de, artırılmış karar ağaçları MART gradyan artırma algoritmasının verimli bir uygulamasını kullanır. Gradyan artırma, regresyon sorunlarına yönelik bir makine öğrenmesi tekniğidir. Her bir regresyon ağacını adımlara göre oluşturur ve her adımda hatayı ölçmek ve sonraki adımda düzeltmek için önceden tanımlanmış bir kayıp işlevi kullanılır. Bu nedenle tahmin modeli aslında daha zayıf tahmin modellerinin bir topluluğudur.

Regresyon sorunlarında, artırmak adımlara göre bir dizi ağaç oluşturur ve ardından rastgele bir farklıleştirilebilir kayıp işlevi kullanarak en uygun ağacı seçer.

Ek bilgi için şu makalelere bakın:

Gradyan artırma yöntemi, uygun bir kayıp işleviyle regresyona indirgenerek sınıflandırma sorunları için de kullanılabilir. Sınıflandırma görevleri için artırılmış ağaçlar uygulaması hakkında daha fazla bilgi için bkz. İki Sınıflı Artırılmış Karar Ağacı.

Artırılmış Karar Ağacı Regresyonu'nun yapılandırılması

  1. Artırılmış Karar Ağacı bileşenini işlem hattınıza ekleyin. Bu bileşeni Machine Learning, Initialize altında , Regresyon kategorisi altında bulabilirsiniz.

  2. Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitileceğini belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız ve bağımsız değişken olarak belirli bir değer kümesi sağlamak istiyorsanız bu seçeneği belirleyin.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve parametre süpürme işlemi çalıştırmak istiyorsanız bu seçeneği belirleyin. Yinelemek için bir değer aralığı seçin; Ayarlama Modeli Hiper Parametreleri , en iyi sonuçları oluşturan hiper parametreleri belirlemek için sağladığınız ayarların tüm olası birleşimleri üzerinde yinelenir.

  3. Ağaç başına en fazla yaprak sayısı: Herhangi bir ağaçta oluşturulabilecek en fazla terminal düğümü (yaprak) sayısını belirtin.

    Bu değeri artırarak, fazla uygunluk ve daha uzun eğitim süresi riskiyle ağacın boyutunu artırabilir ve daha iyi bir hassasiyet elde edebilirsiniz.

  4. Yaprak düğüm başına en az örnek sayısı: Ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az servis talebi sayısını belirtin.

    Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız. Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız eğitim verilerinin aynı koşullara uyan en az 5 servis talebi içermesi gerekir.

  5. Öğrenme oranı: Öğrenme sırasında adım boyutunu tanımlayan 0 ile 1 arasında bir sayı yazın. Öğrenme hızı, öğrencilerin en uygun çözümde ne kadar hızlı veya yavaş yakınsadığını belirler. Adım boyutu çok büyükse, en uygun çözümü aşırı kullanabilirsiniz. Adım boyutu çok küçükse eğitimin en iyi çözüme yakınsanmasını sağlamak daha uzun sürer.

  6. Oluşturulan ağaç sayısı: Toplulukta oluşturulacak toplam karar ağacı sayısını gösterir. Daha fazla karar ağacı oluşturarak daha iyi kapsama alanı elde edebilirsiniz, ancak eğitim süresi artar.

    Değeri 1 olarak ayarlarsanız; ancak yalnızca bir ağaç oluşturulur (ilk parametre kümesine sahip ağaç) ve başka yineleme yapılmaz.

  7. Rastgele sayı tohumu: Rastgele tohum değeri olarak kullanmak üzere isteğe bağlı negatif olmayan bir tamsayı yazın. Bir tohum belirtmek, aynı veri ve parametrelere sahip çalıştırmalar arasında yeniden üretilebilirliği güvence altına alır.

    Varsayılan olarak, rastgele tohum 0 olarak ayarlanır ve bu da ilk tohum değerinin sistem saatinden alındığı anlamına gelir.

  8. Modeli eğitin:

    Not

    Modeli Eğitmek için bir parametre aralığı geçirirseniz, tek parametre listesindeki yalnızca varsayılan değeri kullanır.

    Model Ayarlama Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir dizi ayar beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile belirttiğiniz tek değer süpürme boyunca kullanılır.

  9. İşlem hattını gönderin.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Modeli puanlama için kullanmak üzere Modeli Puanlamamodeline bağlayarak yeni giriş örneklerinin değerlerini tahmin edin.

  • Eğitilen modelin anlık görüntüsünü kaydetmek için Eğitilen modelin sağ panelinde Çıkışlar sekmesini seçin ve Veri kümesini kaydet simgesine tıklayın. Eğitilen modelin kopyası bileşen ağacında bileşen olarak kaydedilir ve işlem hattının ardışık çalıştırmalarında güncelleştirilmez.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.