Hızlı Orman Dağılım Dilimi Regresyonu

Bu makalede Azure Machine Learning tasarımcısındaki bir modül açıklanmaktadır.

Bir işlem hattında hızlı orman nicel regresyon modeli oluşturmak için bu bileşeni kullanın. Hızlı orman nicel regresyonu, tek bir ortalama tahmin değeri almak yerine tahmin edilen değerin dağılımı hakkında daha fazla bilgi edinmek istiyorsanız yararlıdır. Bu yöntemin aşağıdakiler dahil olmak üzere birçok uygulaması vardır:

  • Fiyatları tahmin etme

  • Çocuk gelişimini değerlendirmek için öğrenci performansını tahmin etme veya büyüme grafikleri uygulama

  • Değişkenler arasında yalnızca zayıf bir ilişki olduğu durumlarda tahmine dayalı ilişkileri bulma

Bu regresyon algoritması denetimli bir öğrenme yöntemidir ve bu da etiket sütunu içeren etiketli bir veri kümesi gerektirdiği anlamına gelir. Bu bir regresyon algoritması olduğundan, etiket sütunu yalnızca sayısal değerler içermelidir.

Nicel regresyon hakkında daha fazla bilgi

Birçok farklı regresyon türü vardır. Basitçe ifade etmek gerekirse regresyon, modeli sayısal vektör olarak ifade edilen bir hedefe uydurmak anlamına gelir. Ancak istatistikçiler regresyon için giderek daha gelişmiş yöntemler geliştirmektedir.

Quantile'in en basit tanımı, bir veri kümesini eşit boyutlu gruplara bölen bir değerdir; bu nedenle, nicel değerler gruplar arasındaki sınırları işaretler. İstatistiksel olarak, niceller, rastgele bir değişkenin kümülatif dağılım işlevinin (CDF) tersinden düzenli aralıklarla alınan değerlerdir.

Doğrusal regresyon modelleri tek bir tahmin kullanarak sayısal değişkenin değerini tahmin etmeye çalışırken ortalama, bazen hedef değişkenin aralığını veya tüm dağılımını tahmin etmeniz gerekir. Bu amaçla Bayes regresyonu ve nicel regresyon gibi teknikler geliştirilmiştir.

Nicel regresyon, tahmin edilen değerin dağılımını anlamanıza yardımcı olur. Bu bileşende kullanılan model gibi ağaç tabanlı nicel regresyon modelleri, parametrik olmayan dağılımları tahmin etmek için kullanılabilecek ek avantaja sahiptir.

Hızlı Orman Miktar Regresyonu nasıl yapılandırılır?

  1. Hızlı Orman Quantile Regresyon bileşenini tasarımcıdaki işlem hattınıza ekleyin. Bu bileşeni Makine Öğrenmesi Algoritmaları altında Regresyon kategorisinde bulabilirsiniz.

  2. Hızlı Orman Quantile Regresyon bileşeninin sağ bölmesinde, Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitilmesini istediğinizi belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayın. Modeli eğitirken Modeli Eğit'i kullanın.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz, Tune Model Hyperparameters bileşenini kullanarak bir parametre taraması yapın. Eğitmen, en uygun yapılandırmayı bulmak için belirttiğiniz birden çok değer üzerinde yinelenir.

  3. Ağaç Sayısı, toplulukta oluşturulabilecek en fazla ağaç sayısını yazın. Daha fazla ağaç oluşturursanız, genellikle daha yüksek doğruluk sağlar, ancak daha uzun eğitim süresi karşılığında.

  4. Yaprak Sayısı, herhangi bir ağaçta oluşturulabilecek en fazla yaprak sayısını veya terminal düğümlerini yazın.

  5. Yaprak oluşturmak için gereken en az eğitim örneği sayısı, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az örnek sayısını belirtin.

    Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız. Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız, eğitim verilerinin aynı koşullara uyan en az 5 servis talebi içermesi gerekir.

  6. Kesir bagging, her nicel grubu oluştururken kullanılacak örneklerin kesirini temsil eden 0 ile 1 arasında bir sayı belirtin. Örnekler rastgele seçilir ve bunlar değiştirilir.

  7. Bölme kesirli, 0 ile 1 arasında bir sayı yazın ve bu sayı, ağacın her bir bölmesinde kullanılacak özelliklerin kesirini temsil eder. Kullanılan özellikler her zaman rastgele seçilir.

  8. Tahmin edilecek niceller, modelin eğitmesini ve tahmin oluşturmasını istediğiniz nicellerin noktalı virgülle ayrılmış bir listesini yazın.

    Örneğin, dörttebirlik değerleri tahmin eden bir model oluşturmak istiyorsanız yazın 0.25; 0.5; 0.75.

  9. İsteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucuyu görmek için Rastgele sayı tohumu için bir değer yazın. Varsayılan değer 0'dır ve rastgele bir tohum seçilir.

    Aynı veriler üzerinde ardışık çalıştırmalarda sonuçları yeniden oluşturmanız gerekiyorsa bir değer sağlamanız gerekir.

  10. Eğitim veri kümesini ve eğitilmeyen modeli eğitim bileşenlerinden birine Bağlan:

    Uyarı

    • Modeli Eğitme'ye bir parametre aralığı geçirirseniz, parametre aralığı listesindeki yalnızca ilk değeri kullanır.

    • Ayarlama Modeli Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir ayar aralığı beklediğinde, değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    • Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile, belirttiğiniz tek değer süpürme boyunca kullanılır.

  11. İşlem hattını gönderin.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Eğitilen modelin anlık görüntüsünü kaydetmek için eğitim bileşenini seçin, ardından sağ panelde Outputs+logs sekmesine geçin. Veri kümesini kaydet simgesine tıklayın. Kaydedilen modeli bileşen ağacında bileşen olarak bulabilirsiniz.

Değerlendirme ölçümleri

Eğitilen modeli değerlendirmek için Modeli Değerlendir bileşenini kullanabilirsiniz. Hızlı Orman Nicel Regresyonu için ölçümler aşağıdaki gibidir.

  • Nicelik Kaybı: Bu, modelinizdeki belirli bir nicele ilgili hatanın ölçüsüdür.
  • Ortalama Nicelik Kaybı: Bu, modelde kabul edilen tüm nicellerde Miktar Kaybı değerlerinin ortalamasıdır. Modelin tüm nicellerde ne kadar iyi performans sergilediğinden genel bir ölçü sağlar.

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.