Two-Class Artırılmış Karar Ağacı bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Artırılmış karar ağaçları algoritmasını temel alan bir makine öğrenmesi modeli oluşturmak için bu bileşeni kullanın.

Artırılmış karar ağacı, ikinci ağacın ilk ağacın hatalarını düzeltdiği, üçüncü ağacın birinci ve ikinci ağaçların hatalarını düzeltdiği vb. bir topluluk öğrenme yöntemidir. Tahminler, tahminde bulunan ağaç topluluğunun tamamını temel alır.

Genel olarak, doğru yapılandırıldığında, artırılmış karar ağaçları çok çeşitli makine öğrenmesi görevlerinde en iyi performansı elde etmek için en kolay yöntemlerdir. Ancak, bunlar aynı zamanda bellek açısından daha yoğun öğrencilerden biridir ve geçerli uygulama bellekteki her şeyi barındırır. Bu nedenle, artırılmış bir karar ağacı modeli bazı doğrusal öğrencilerin işleyebileceği büyük veri kümelerini işleyemeyebilir.

Bu bileşen LightGBM algoritmayı temel alır.

Yapılandırma

Bu bileşen eğitilmemiş bir sınıflandırma modeli oluşturur. Sınıflandırma denetimli bir öğrenme yöntemi olduğundan modeli eğitmek için tüm satırlar için değer içeren bir etiket sütunu içeren etiketli bir veri kümesine ihtiyacınız vardır.

Modeli Eğit'i kullanarak bu tür bir modeli eğitebilirsiniz.

  1. Azure Machine Learning'de, artırılmış karar ağacı bileşenini işlem hattınıza ekleyin.

  2. Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitileceğini belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz , Modeli Ayarlama Hiper Parametreleri bileşenini kullanarak en uygun parametreleri bulabilirsiniz. Bazı değer aralıkları sağlarsınız ve eğitmen, en iyi sonucu veren değerlerin birleşimini belirlemek için ayarların birden çok bileşimini yineler.

  3. Ağaç başına en fazla yaprak sayısı için, herhangi bir ağaçta oluşturulabilecek en fazla terminal düğümü (yaprak) sayısını belirtin.

    Bu değeri artırarak, fazla uygunluk ve daha uzun eğitim süresi riskiyle ağacın boyutunu artırabilir ve daha iyi bir hassasiyet elde edebilirsiniz.

  4. Yaprak düğüm başına en az örnek sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken durum sayısını belirtin.

    Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız. Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız eğitim verilerinin aynı koşullara uyan en az beş durum içermesi gerekir.

  5. Öğrenme oranı için, öğrenme sırasındaki adım boyutunu tanımlayan 0 ile 1 arasında bir sayı yazın.

    Öğrenme hızı, öğrencilerin en uygun çözümde ne kadar hızlı veya yavaş yakınsadığını belirler. Adım boyutu çok büyükse, en uygun çözümü aşırı kullanabilirsiniz. Adım boyutu çok küçükse eğitimin en iyi çözüme yakınsanmasını sağlamak daha uzun sürer.

  6. Inşa edilen ağaç sayısı için, toplulukta oluşturulacak karar ağacının toplam sayısını belirtin. Daha fazla karar ağacı oluşturarak daha iyi kapsama alanı elde edebilirsiniz, ancak eğitim süresi artar.

    Değeri 1 olarak ayarlarsanız, yalnızca bir ağaç oluşturulur (ilk parametre kümesini içeren ağaç) ve başka yineleme yapılmaz.

  7. Rastgele sayı tohumu için isteğe bağlı olarak rastgele tohum değeri olarak kullanılacak negatif olmayan bir tamsayı yazın. Bir tohum belirtmek, aynı veri ve parametrelere sahip çalıştırmalar arasında yeniden üretilebilirliği güvence altına alır.

    Rastgele tohum varsayılan olarak 0 olarak ayarlanır ve bu da ilk tohum değerinin sistem saatinden alındığı anlamına gelir. Rastgele bir tohum kullanan ardışık çalıştırmalar farklı sonuçlara sahip olabilir.

  8. Modeli eğitin:

    Not

    Modeli Eğitmek için bir parametre aralığı geçirirseniz, tek parametre listesindeki yalnızca varsayılan değeri kullanır.

    Model Ayarlama Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir dizi ayar beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile belirttiğiniz tek değer süpürme boyunca kullanılır.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Eğitilen modelin anlık görüntüsünü kaydetmek için Modeli eğit bileşeninin sağ panelindeki Çıkışlar sekmesini seçin. Modeli yeniden kullanılabilir bir bileşen olarak kaydetmek için Veri kümesini kaydet simgesini seçin.

  • Modeli puanlama için kullanmak için Model Puanlama bileşenini bir işlem hattına ekleyin.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.