Aracılığıyla paylaş


Hızlı Orman Dağılım Dilimi Regresyonu

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bir miktar regresyon modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Regresyon

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, Machine Learning Studio'da (klasik) Fast Forest Quantile Regression modülünün, belirtilen sayıdaki sayısal değerlerle ilgili değerleri tahmin edile bir regresyon modeli oluşturmak için nasıl kullanılası açıklanmıştır.

Tek bir ortalama tahmin değeri almak yerine tahmin edilen değerin dağılımı hakkında daha fazla bilgi almak için sayısal regresyon yararlıdır. Bu yöntemin birçok uygulaması vardır, bunlar:

  • Fiyatları tahmin etmek

  • Öğrenci performansını tahmin etmek veya alt geliştirmeyi değerlendirmek için büyüme grafikleri uygulama

  • Değişkenler arasında yalnızca zayıf bir ilişki olduğu durumlarda tahmine dayalı ilişkileri keşfetme

Bu regresyon algoritması denetimli bir öğrenme yöntemidir ve etiket sütunu içeren etiketli bir veri kümesi gerektirir. Bu bir regresyon algoritması olduğundan etiket sütunu yalnızca sayısal değerler içermeli.

Quantile regresyon hakkında daha fazla bilgi

Birçok farklı regresyon türü vardır. Regresyon, en temel anlamda modeli sayısal vektör olarak ifade edilen bir hedefe uydurmak anlamına gelir. Ancak istatistikçiler regresyon için giderek daha gelişmiş yöntemler geliştiriyor.

Gruplamanın en basit tanımı , bir veri kümelerini eşit boyutlu gruplara bölen bir değerdir; Bu nedenle, grupsal değerler gruplar arasındaki sınırları işaret eder. İstatistiksel olarak, niceller rastgele değişkenin kümülatif dağılım işlevinin (CDF) tersinden düzenli aralıklarla alınan değerlerdir.

Doğrusal regresyon modelleri tek bir tahmin (ortalama) kullanarak sayısal değişkenin değerini tahmin etmek isterken bazen hedef değişkenin aralığını veya dağılımının tamamını tahmin etmek gerekir. Bu amaçla Bayes regresyon ve quantile regresyon gibi teknikler geliştirilmiştir.

Sayısal regresyon, tahmin edilen değerin dağılımını anlamanıza yardımcı olur. Bu modülde kullanılan model gibi ağaç tabanlı nicel regresyon modelleri, ametrik olmayan dağılımları tahmin etmek için kullanılmaktadır.

Diğer uygulama ayrıntıları ve kaynakları için Teknik Notlar bölümüne bakın.

Quantile Regres Fast_Forest yapılandırma

Bu modülü kullanarak regresyon modelinin özelliklerini yapılandırıyor ve ardından eğitim modüllerinden birini kullanarak eğitiyorsanız.

Yapılandırma adımları, sabit bir parametre kümesi sağlama veya parametre tarama ayarlamaya bağlı olarak önemli ölçüde farklılık gösterir.

Sabit parametreleri kullanarak bir miktar regresyon modeli oluşturma

Modeli nasıl yapılandırmak istediğinizi bildiğinizi varsayarak, bağımsız değişken olarak belirli bir değer kümesi sebilirsiniz. Modeli eğitken Modeli Eğit'i kullanın.

  1. Studio'da (klasik) denemenize Fast Forest Quantile Regression modülünü ekleyin.

  2. Eğitmen modu oluştur seçeneğini Tek Parametre olarak ayarlayın.

  3. Ağaç Sayısı için, grup içinde oluşturulacak en fazla ağaç sayısını yazın. Daha fazla ağaç oluşturmanız genellikle daha fazla doğruluk sağlar ancak eğitim süresi daha uzun olur.

  4. Yaprak Sayısı için herhangi bir ağaçta oluşturulacak maksimum yaprak sayısını veya terminal düğümlerini yazın.

  5. Yaprak oluşturmak için gereken en düşük eğitim örneği sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en düşük örnek sayısını belirtin.

    Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir

  6. Kesirleri etiketleme için, her grup grup için gruplama hazırlarıken kullanılacak örneklerin kesirlerini temsil eden 0 ile 1 arasında bir sayı belirtin. Örnekler, değiştirme ile birlikte rastgele seçilir.

  7. Özellik kesirleri için, belirli bir ağacın inşası için toplam özelliklerin kesirlerini gösteren 0 ile 1 arasında bir sayı yazın. Özellikler her zaman rastgele seçilir.

  8. Kesir bölme için, ağacın her bir bölmesinde kullanmak üzere özelliklerin kesirlerini temsil eden 0 ile 1 arasında bir sayı yazın. Kullanılan özellikler her zaman rastgele seçilir.

  9. Quantile örnek sayısı için, nicelleri tahmin etmek için değerlendirilecek örnek sayısını yazın.

  10. Tahmin edilen miktarlar için, modelin tahminleri eğitip oluşturması için istediğiniz miktarların virgülle ayrılmış bir listesini yazın.

    Örneğin, dörtte birlik için tahminde bulunduran bir model oluşturmak için yazın 0.25, 0.5, 0.75.

  11. İsteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için Rastgele sayı çekirdeği için bir değer yazın. Varsayılan değer 0'dır, yani rastgele çekirdek seçilir.

    Aynı veriler üzerinde yapılan başarılı çalıştırmalarda sonuçları yeniden oluşturmanız gerekirse bir değer sağlayabilirsiniz.

  12. Bilinmeyen değerler için bir grup oluşturmak için Bilinmeyen kategorik düzeylere izin ver seçeneğini belirleyin.

    Seçimi kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder.

    Bu seçeneği tercih ederseniz, model bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.

  13. Bağlan veri kümesinde tek bir etiket sütunu seçin ve Modeli Eğit'e bağlanabilirsiniz.

  14. Denemeyi çalıştırın.

Bir sayısal regresyon modeli oluşturmak için parametre tarama kullanma

Model için en uygun parametrelerden emin değilsanız bir parametre tarama yapılandırarak bağımsız değişken olarak bir değer aralığı sebilirsiniz. Modeli eğittikte Modeli Ayarlama Hiperparametreleri modülünü kullanın.

  1. Studio'da (klasik) denemenize Fast Forest Quantile Regression modülünü ekleyin.

  2. Eğitmen modu oluştur seçeneğini Parametre Aralığı olarak ayarlayın.

    En iyi parametrelerden emin değilsanız parametre tarama önerilir. Birden çok değer belirterek ve modeli eğitmek için Modeli Ayarla Hiper parametreleri modülünü kullanarak verileriniz için en uygun parametre kümesine bakabilirsiniz.

    Parametre tarama seçtikten sonra ayarlanabilir her özellik için tek bir değer veya birden çok değer belirtebilirsiniz. Örneğin, ağaç sayısını düzeltmeye karar ve ardından her ağacın nasıl inşa edileceklerini kontrol altına alan diğer değerleri rastgele değiştirebilirsiniz.

    • Tek bir değer yazsanız, diğer değerler değişse bile bu değer taramanın tüm yinelemeleri arasında kullanılır.

    • Kullanmak istediğiniz ayrık değerlerin virgülle ayrılmış bir listesini yazın. Bu değerler diğer özelliklerle birlikte kullanılır.

    • Aralık Oluşturucusu'nu kullanarak bir dizi sürekli değer tanımlayın.

    Eğitim işlemi sırasında Model Ayarlama Hiperparametreleri modülü, en iyi modeli oluşturmak için çeşitli değer birleşimleri üzerinde tekrarlar.

  3. Ağaç başına en fazla yaprak sayısı için, her bir ağaçta izin vermek için toplam yaprak sayısını veya terminal düğümlerini yazın.

  4. Oluşturulmuş ağaç sayısı için grubu oluşturulurken gerçekleştirecek yineleme sayısını yazın. Daha fazla ağaç oluşturarak daha fazla eğitim süresi harcamadan daha iyi bir kapsama sahip olma potansiyeline sahipsiniz.

  5. Yaprak düğüm başına en az örnek sayısı için, yaprak düğüm oluşturmak için gereken örnek sayısını gösterir.

    Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir.

  6. Kesirleri etiketleme aralığı'nda, her grup grup için gruplama için kullanılacak örneklerin kesirlerini yazın. Örnekler, değiştirme ile birlikte rastgele seçilir.

    Her kesir 0 ile 1 arasında bir sayıdır. Virgül kullanarak birden çok kesir ayırma.

  7. Özellik kesirleri için Aralık'ta, her bir grup için toplam özellik grubu hazırlarken kullanmak üzere toplam özelliklerin kesirlerini yazın. Özellikler rastgele seçilir.

    Her kesir 0 ile 1 arasında bir sayı olmalı; virgül kullanarak birden çok kesir ayırma.

  8. Bölme kesirleri için Aralık'ta, her grup gruplarında kullanmak üzere bazı özellik kesirleri belirtin. Kullanılan gerçek özellikler rastgele seçilir.

    Her kesir 0 ile 1 arasında bir sayı olmalı; virgül kullanarak birden çok kesir ayırma.

  9. Miktarları tahmin etmek için kullanılan örnek sayısı'nın içinde, nicelleri tahmin etmek için kaç örneğin değerlendirilecek olduğunu belirtin. Kullanılabilir örnek sayısından büyük bir sayı yazsanız tüm örnekler kullanılır.

  10. Gerekli nicel değerler'de, modelin eğitilmalarını istediğiniz nicellerin virgülle ayrılmış bir listesini yazın. Örneğin, dörttebirlik tahminleri olan bir model oluşturmak için '0,25, 0,5, 0,75 yazın

  11. Rastgele sayı çekirdeği'ne, model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için bir değer yazın. Çekirdek kullanımı, yinelenen çalıştırmaları yeniden oluşturmak için yararlıdır.

    Varsayılan değer 0'dır, yani rastgele çekirdek seçilir.

  12. Eğitim veya doğrulama kümelerini bilinmeyen değerler için bir grup oluşturmak için Kategorik özellikler için bilinmeyen değerlere izin ver seçeneğini belirleyin.

    Bu seçeneğin seçimini kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder.

    Bu seçeneği tercih ederseniz, model bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.

  13. Bağlan veri kümesinde etiket sütununu seçin ve Model Ayarlama Hiperparametreleri modülünü bağlama.

    Not

    Modeli Eğit'i kullanma. Bir parametre aralığı yapılandırdı ancak Modeli Eğit'i kullanarak eğitirken parametre aralığı listesinde yalnızca ilk değeri kullanır.

  14. Denemeyi çalıştırın.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • İyileştirilmiş modelin son hiperparametrelerini görmek için Model Ayarlama HiperParametreleri çıkışına sağ tıklayın ve Görselleştir'iseçin.

Örnekler

Bu modülü kullanma örnekleri için bkz. Azure Yapay Zeka Galerisi:

  • Quantile Regresyon: Otomatik fiyat veri kümesi kullanılarak bir nicel regresyon modelinin nasıl derleme ve yorumlanması olduğunu gösterir.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

Uygulama ayrıntıları

Machine Learning'daki Fast Forest Quantile Regression modülü, karar ağaçlarını kullanarak rastgele orman miktar regresyonu uygulamasıdır. Rastgele ormanlar, karar ağaçlarıyla meydana gelen fazlalıkları önlemeye yardımcı olabilir. Karar ağacı, her iç düğümde giriş özelliklerinden birinin değerine göre iki alt düğümden hangisinin devam edeceğinin karar aldığı ikili ağaç gibi bir akış grafiğidir.

Her yaprak düğümde bir değer döndürülür. İç düğümlerde karar , ''x≤v' testini temel almaktadır. Burada x, giriş örneğindeki özelliğin değeridir ve v bu özelliğin olası değerlerindendir. Regresyon ağacı tarafından üretilecek işlevlerin hepsi parçalı sabit işlevlerdir.

Rastgele bir ormanda, eğitim verilerinin rastgele örneklerin ve özelliklerin bir alt kümesini seçmek ve ardından her veri alt kümesine bir karar ağacı sığdırmak için etiketleme kullanılarak bir ağaç grubu oluşturulur. Tüm ağaçlarının çıkışını ortalama alan rastgele orman algoritmasının aksine, Hızlı Orman Quantile Regresyon , Quantile örnek sayısı parametresi tarafından belirtilen ağaçlarda tahmin edilen tüm etiketleri tutar ve dağıtımı çıkış olarak verir, böylece kullanıcı belirli bir örnek için miktar değerlerini görüntülemeye devam eder.

Sayısal regresyon hakkında daha fazla bilgi için şu kitaplara ve makalelere bakın:

Modül parametreleri

Ad Tür Aralık İsteğe Bağlı Description Varsayılan
Eğitmen modu oluşturma CreateLearnerMode List:Single Parameter| Parametre Aralığı Gerekli Tek Parametre Gelişmiş öğrenici seçenekleri oluşturma
Ağaç Sayısı Tamsayı mode:Tek Parametre 100 Kaç ağaç oluşturulur?
Yaprak Sayısı Tamsayı mode:Tek Parametre 20 Ağaç başına en fazla yaprak sayısını belirtin. Varsayılan sayı 20'dir
Yaprak oluşturmak için gereken en düşük eğitim örneği sayısı Tamsayı mode:Tek Parametre 10 Yaprak oluşturmak için gereken en az eğitim örneği sayısını gösterir
Kesir etiketleme Float mode:Tek Parametre 0.7 Her ağaç için kullanmak üzere eğitim verisi kesirlerini belirtir
Özellik kesri Float mode:Tek Parametre 0.7 Her ağaç için kullanmak üzere özelliklerin kesirlerini (rastgele seçilen) belirtir
Kesir bölme Float mode:Tek Parametre 0.7 Her bölmede kullanmak üzere özelliklerin kesirlerini (rastgele seçilen) belirtir
Miktar örnek sayısı Tamsayı Maksimum: 2147483647 mode:Tek Parametre 100 Miktarları tahmin etmek için her düğümde kullanılan örnek sayısını belirtir
Tahmini miktarlar Dize mode:Tek Parametre "0.25;0.5;0.75" Tahmin edilen miktar nicel değeri belirtir
Rastgele sayı çekirdeği Tamsayı İsteğe Bağlı Model tarafından kullanılan rastgele sayı oluşturucu için bir çekirdek sağlama. Varsayılan olarak boş bırakın.
Bilinmeyen kategorik düzeylere izin ver Boole Gerekli true True ise, her kategorik sütun için ek bir düzey oluşturun. Eğitim veri kümesinde mevcut olan test veri kümesi düzeyleri bu ek düzeye eşlenmiş.
Ağaç başına en fazla yaprak sayısı ParameterRangeSettings [16;128] mode:Parametre Aralığı 16; 32; 64 Ağaç başına izin verilen en fazla yaprak sayısı için aralığı belirtin
Oluşturulmuş ağaç sayısı ParameterRangeSettings [1;256] mode:Parametre Aralığı 16; 32; 64 Eğitim sırasında oluşturulacak en fazla ağaç sayısı aralığını belirtin
Yaprak düğüm başına en az örnek sayısı ParameterRangeSettings [1;10] mode:Parametre Aralığı 1; 5; 10 Yaprak oluşturmak için gereken en az servis sayısı aralığını belirtin
Kesir etiketleme aralığı ParameterRangeSettings [0.25;1.0] mode:Parametre Aralığı 0.25; 0.5; 0.75 Her ağaç için eğitim verisi kesirlerinin aralığını belirtir
Özellik kesir aralığı ParameterRangeSettings [0.25;1.0] mode:Parametre Aralığı 0.25; 0.5; 0.75 Her ağaç için kullanmak üzere özelliklerin kesirli (rastgele seçilen) aralığını belirtir
Bölme kesri aralığı ParameterRangeSettings [0.25;1.0] mode:Parametre Aralığı 0.25; 0.5; 0.75 Her bölmede kullanmak üzere özelliklerin kesirli (rastgele seçilen) aralığını belirtir
Miktarları tahmin etmek için kullanılan örnek sayısı Tamsayı mode:Parametre Aralığı 100 Miktarları tahmin etmek için kullanılan örnek sayısı
Gerekli miktar değerleri Dize mode:Parametre Aralığı "0.25;0.5;0.75" Parametre tarama sırasında kullanılan gerekli miktar değeri

Çıkışlar

Ad Tür Description
Eğitilmemiş model ILearner arabirimi Genel Modeli Eğit veya Modeli Çapraz Doğrula modüllerine bağlanan, eğitilmemiş bir quantile regresyon modeli.

Ayrıca bkz.

Regresyon