Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Bir miktar regresyon modeli oluşturur
Kategori: Machine Learning / Modeli Başlatma / Regresyon
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle genel bakış
Bu makalede, Machine Learning Studio'da (klasik) Fast Forest Quantile Regression modülünün, belirtilen sayıdaki sayısal değerlerle ilgili değerleri tahmin edile bir regresyon modeli oluşturmak için nasıl kullanılası açıklanmıştır.
Tek bir ortalama tahmin değeri almak yerine tahmin edilen değerin dağılımı hakkında daha fazla bilgi almak için sayısal regresyon yararlıdır. Bu yöntemin birçok uygulaması vardır, bunlar:
Fiyatları tahmin etmek
Öğrenci performansını tahmin etmek veya alt geliştirmeyi değerlendirmek için büyüme grafikleri uygulama
Değişkenler arasında yalnızca zayıf bir ilişki olduğu durumlarda tahmine dayalı ilişkileri keşfetme
Bu regresyon algoritması denetimli bir öğrenme yöntemidir ve etiket sütunu içeren etiketli bir veri kümesi gerektirir. Bu bir regresyon algoritması olduğundan etiket sütunu yalnızca sayısal değerler içermeli.
Quantile regresyon hakkında daha fazla bilgi
Birçok farklı regresyon türü vardır. Regresyon, en temel anlamda modeli sayısal vektör olarak ifade edilen bir hedefe uydurmak anlamına gelir. Ancak istatistikçiler regresyon için giderek daha gelişmiş yöntemler geliştiriyor.
Gruplamanın en basit tanımı , bir veri kümelerini eşit boyutlu gruplara bölen bir değerdir; Bu nedenle, grupsal değerler gruplar arasındaki sınırları işaret eder. İstatistiksel olarak, niceller rastgele değişkenin kümülatif dağılım işlevinin (CDF) tersinden düzenli aralıklarla alınan değerlerdir.
Doğrusal regresyon modelleri tek bir tahmin (ortalama) kullanarak sayısal değişkenin değerini tahmin etmek isterken bazen hedef değişkenin aralığını veya dağılımının tamamını tahmin etmek gerekir. Bu amaçla Bayes regresyon ve quantile regresyon gibi teknikler geliştirilmiştir.
Sayısal regresyon, tahmin edilen değerin dağılımını anlamanıza yardımcı olur. Bu modülde kullanılan model gibi ağaç tabanlı nicel regresyon modelleri, ametrik olmayan dağılımları tahmin etmek için kullanılmaktadır.
Diğer uygulama ayrıntıları ve kaynakları için Teknik Notlar bölümüne bakın.
Quantile Regres Fast_Forest yapılandırma
Bu modülü kullanarak regresyon modelinin özelliklerini yapılandırıyor ve ardından eğitim modüllerinden birini kullanarak eğitiyorsanız.
Yapılandırma adımları, sabit bir parametre kümesi sağlama veya parametre tarama ayarlamaya bağlı olarak önemli ölçüde farklılık gösterir.
Sabit parametreleri kullanarak bir miktar regresyon modeli oluşturmak için
Parametre tarama kullanarak bir miktar regresyon modeli oluşturmak için
Sabit parametreleri kullanarak bir miktar regresyon modeli oluşturma
Modeli nasıl yapılandırmak istediğinizi bildiğinizi varsayarak, bağımsız değişken olarak belirli bir değer kümesi sebilirsiniz. Modeli eğitken Modeli Eğit'i kullanın.
Studio'da (klasik) denemenize Fast Forest Quantile Regression modülünü ekleyin.
Eğitmen modu oluştur seçeneğini Tek Parametre olarak ayarlayın.
Ağaç Sayısı için, grup içinde oluşturulacak en fazla ağaç sayısını yazın. Daha fazla ağaç oluşturmanız genellikle daha fazla doğruluk sağlar ancak eğitim süresi daha uzun olur.
Yaprak Sayısı için herhangi bir ağaçta oluşturulacak maksimum yaprak sayısını veya terminal düğümlerini yazın.
Yaprak oluşturmak için gereken en düşük eğitim örneği sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en düşük örnek sayısını belirtin.
Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir
Kesirleri etiketleme için, her grup grup için gruplama hazırlarıken kullanılacak örneklerin kesirlerini temsil eden 0 ile 1 arasında bir sayı belirtin. Örnekler, değiştirme ile birlikte rastgele seçilir.
Özellik kesirleri için, belirli bir ağacın inşası için toplam özelliklerin kesirlerini gösteren 0 ile 1 arasında bir sayı yazın. Özellikler her zaman rastgele seçilir.
Kesir bölme için, ağacın her bir bölmesinde kullanmak üzere özelliklerin kesirlerini temsil eden 0 ile 1 arasında bir sayı yazın. Kullanılan özellikler her zaman rastgele seçilir.
Quantile örnek sayısı için, nicelleri tahmin etmek için değerlendirilecek örnek sayısını yazın.
Tahmin edilen miktarlar için, modelin tahminleri eğitip oluşturması için istediğiniz miktarların virgülle ayrılmış bir listesini yazın.
Örneğin, dörtte birlik için tahminde bulunduran bir model oluşturmak için yazın
0.25, 0.5, 0.75.İsteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için Rastgele sayı çekirdeği için bir değer yazın. Varsayılan değer 0'dır, yani rastgele çekirdek seçilir.
Aynı veriler üzerinde yapılan başarılı çalıştırmalarda sonuçları yeniden oluşturmanız gerekirse bir değer sağlayabilirsiniz.
Bilinmeyen değerler için bir grup oluşturmak için Bilinmeyen kategorik düzeylere izin ver seçeneğini belirleyin.
Seçimi kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder.
Bu seçeneği tercih ederseniz, model bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.
Bağlan veri kümesinde tek bir etiket sütunu seçin ve Modeli Eğit'e bağlanabilirsiniz.
Denemeyi çalıştırın.
Bir sayısal regresyon modeli oluşturmak için parametre tarama kullanma
Model için en uygun parametrelerden emin değilsanız bir parametre tarama yapılandırarak bağımsız değişken olarak bir değer aralığı sebilirsiniz. Modeli eğittikte Modeli Ayarlama Hiperparametreleri modülünü kullanın.
Studio'da (klasik) denemenize Fast Forest Quantile Regression modülünü ekleyin.
Eğitmen modu oluştur seçeneğini Parametre Aralığı olarak ayarlayın.
En iyi parametrelerden emin değilsanız parametre tarama önerilir. Birden çok değer belirterek ve modeli eğitmek için Modeli Ayarla Hiper parametreleri modülünü kullanarak verileriniz için en uygun parametre kümesine bakabilirsiniz.
Parametre tarama seçtikten sonra ayarlanabilir her özellik için tek bir değer veya birden çok değer belirtebilirsiniz. Örneğin, ağaç sayısını düzeltmeye karar ve ardından her ağacın nasıl inşa edileceklerini kontrol altına alan diğer değerleri rastgele değiştirebilirsiniz.
Tek bir değer yazsanız, diğer değerler değişse bile bu değer taramanın tüm yinelemeleri arasında kullanılır.
Kullanmak istediğiniz ayrık değerlerin virgülle ayrılmış bir listesini yazın. Bu değerler diğer özelliklerle birlikte kullanılır.
Aralık Oluşturucusu'nu kullanarak bir dizi sürekli değer tanımlayın.
Eğitim işlemi sırasında Model Ayarlama Hiperparametreleri modülü, en iyi modeli oluşturmak için çeşitli değer birleşimleri üzerinde tekrarlar.
Ağaç başına en fazla yaprak sayısı için, her bir ağaçta izin vermek için toplam yaprak sayısını veya terminal düğümlerini yazın.
Oluşturulmuş ağaç sayısı için grubu oluşturulurken gerçekleştirecek yineleme sayısını yazın. Daha fazla ağaç oluşturarak daha fazla eğitim süresi harcamadan daha iyi bir kapsama sahip olma potansiyeline sahipsiniz.
Yaprak düğüm başına en az örnek sayısı için, yaprak düğüm oluşturmak için gereken örnek sayısını gösterir.
Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir.
Kesirleri etiketleme aralığı'nda, her grup grup için gruplama için kullanılacak örneklerin kesirlerini yazın. Örnekler, değiştirme ile birlikte rastgele seçilir.
Her kesir 0 ile 1 arasında bir sayıdır. Virgül kullanarak birden çok kesir ayırma.
Özellik kesirleri için Aralık'ta, her bir grup için toplam özellik grubu hazırlarken kullanmak üzere toplam özelliklerin kesirlerini yazın. Özellikler rastgele seçilir.
Her kesir 0 ile 1 arasında bir sayı olmalı; virgül kullanarak birden çok kesir ayırma.
Bölme kesirleri için Aralık'ta, her grup gruplarında kullanmak üzere bazı özellik kesirleri belirtin. Kullanılan gerçek özellikler rastgele seçilir.
Her kesir 0 ile 1 arasında bir sayı olmalı; virgül kullanarak birden çok kesir ayırma.
Miktarları tahmin etmek için kullanılan örnek sayısı'nın içinde, nicelleri tahmin etmek için kaç örneğin değerlendirilecek olduğunu belirtin. Kullanılabilir örnek sayısından büyük bir sayı yazsanız tüm örnekler kullanılır.
Gerekli nicel değerler'de, modelin eğitilmalarını istediğiniz nicellerin virgülle ayrılmış bir listesini yazın. Örneğin, dörttebirlik tahminleri olan bir model oluşturmak için '0,25, 0,5, 0,75 yazın
Rastgele sayı çekirdeği'ne, model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için bir değer yazın. Çekirdek kullanımı, yinelenen çalıştırmaları yeniden oluşturmak için yararlıdır.
Varsayılan değer 0'dır, yani rastgele çekirdek seçilir.
Eğitim veya doğrulama kümelerini bilinmeyen değerler için bir grup oluşturmak için Kategorik özellikler için bilinmeyen değerlere izin ver seçeneğini belirleyin.
Bu seçeneğin seçimini kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder.
Bu seçeneği tercih ederseniz, model bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.
Bağlan veri kümesinde etiket sütununu seçin ve Model Ayarlama Hiperparametreleri modülünü bağlama.
Not
Modeli Eğit'i kullanma. Bir parametre aralığı yapılandırdı ancak Modeli Eğit'i kullanarak eğitirken parametre aralığı listesinde yalnızca ilk değeri kullanır.
Denemeyi çalıştırın.
Sonuçlar
Eğitim tamamlandıktan sonra:
- İyileştirilmiş modelin son hiperparametrelerini görmek için Model Ayarlama HiperParametreleri çıkışına sağ tıklayın ve Görselleştir'iseçin.
Örnekler
Bu modülü kullanma örnekleri için bkz. Azure Yapay Zeka Galerisi:
- Quantile Regresyon: Otomatik fiyat veri kümesi kullanılarak bir nicel regresyon modelinin nasıl derleme ve yorumlanması olduğunu gösterir.
Teknik notlar
Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.
Uygulama ayrıntıları
Machine Learning'daki Fast Forest Quantile Regression modülü, karar ağaçlarını kullanarak rastgele orman miktar regresyonu uygulamasıdır. Rastgele ormanlar, karar ağaçlarıyla meydana gelen fazlalıkları önlemeye yardımcı olabilir. Karar ağacı, her iç düğümde giriş özelliklerinden birinin değerine göre iki alt düğümden hangisinin devam edeceğinin karar aldığı ikili ağaç gibi bir akış grafiğidir.
Her yaprak düğümde bir değer döndürülür. İç düğümlerde karar , ''x≤v' testini temel almaktadır. Burada x, giriş örneğindeki özelliğin değeridir ve v bu özelliğin olası değerlerindendir. Regresyon ağacı tarafından üretilecek işlevlerin hepsi parçalı sabit işlevlerdir.
Rastgele bir ormanda, eğitim verilerinin rastgele örneklerin ve özelliklerin bir alt kümesini seçmek ve ardından her veri alt kümesine bir karar ağacı sığdırmak için etiketleme kullanılarak bir ağaç grubu oluşturulur. Tüm ağaçlarının çıkışını ortalama alan rastgele orman algoritmasının aksine, Hızlı Orman Quantile Regresyon , Quantile örnek sayısı parametresi tarafından belirtilen ağaçlarda tahmin edilen tüm etiketleri tutar ve dağıtımı çıkış olarak verir, böylece kullanıcı belirli bir örnek için miktar değerlerini görüntülemeye devam eder.
İlgili araştırma
Sayısal regresyon hakkında daha fazla bilgi için şu kitaplara ve makalelere bakın:
Quantile Regresyon Ormanları. Illalai Meinshausen
http://jmlr.org/papers/volume7/meinshausen06a/meinshausen06a.pdf
Rastgele ormanlar. Leo Breiman.
Modül parametreleri
| Ad | Tür | Aralık | İsteğe Bağlı | Description | Varsayılan |
|---|---|---|---|---|---|
| Eğitmen modu oluşturma | CreateLearnerMode | List:Single Parameter| Parametre Aralığı | Gerekli | Tek Parametre | Gelişmiş öğrenici seçenekleri oluşturma |
| Ağaç Sayısı | Tamsayı | mode:Tek Parametre | 100 | Kaç ağaç oluşturulur? | |
| Yaprak Sayısı | Tamsayı | mode:Tek Parametre | 20 | Ağaç başına en fazla yaprak sayısını belirtin. Varsayılan sayı 20'dir | |
| Yaprak oluşturmak için gereken en düşük eğitim örneği sayısı | Tamsayı | mode:Tek Parametre | 10 | Yaprak oluşturmak için gereken en az eğitim örneği sayısını gösterir | |
| Kesir etiketleme | Float | mode:Tek Parametre | 0.7 | Her ağaç için kullanmak üzere eğitim verisi kesirlerini belirtir | |
| Özellik kesri | Float | mode:Tek Parametre | 0.7 | Her ağaç için kullanmak üzere özelliklerin kesirlerini (rastgele seçilen) belirtir | |
| Kesir bölme | Float | mode:Tek Parametre | 0.7 | Her bölmede kullanmak üzere özelliklerin kesirlerini (rastgele seçilen) belirtir | |
| Miktar örnek sayısı | Tamsayı | Maksimum: 2147483647 | mode:Tek Parametre | 100 | Miktarları tahmin etmek için her düğümde kullanılan örnek sayısını belirtir |
| Tahmini miktarlar | Dize | mode:Tek Parametre | "0.25;0.5;0.75" | Tahmin edilen miktar nicel değeri belirtir | |
| Rastgele sayı çekirdeği | Tamsayı | İsteğe Bağlı | Model tarafından kullanılan rastgele sayı oluşturucu için bir çekirdek sağlama. Varsayılan olarak boş bırakın. | ||
| Bilinmeyen kategorik düzeylere izin ver | Boole | Gerekli | true | True ise, her kategorik sütun için ek bir düzey oluşturun. Eğitim veri kümesinde mevcut olan test veri kümesi düzeyleri bu ek düzeye eşlenmiş. | |
| Ağaç başına en fazla yaprak sayısı | ParameterRangeSettings | [16;128] | mode:Parametre Aralığı | 16; 32; 64 | Ağaç başına izin verilen en fazla yaprak sayısı için aralığı belirtin |
| Oluşturulmuş ağaç sayısı | ParameterRangeSettings | [1;256] | mode:Parametre Aralığı | 16; 32; 64 | Eğitim sırasında oluşturulacak en fazla ağaç sayısı aralığını belirtin |
| Yaprak düğüm başına en az örnek sayısı | ParameterRangeSettings | [1;10] | mode:Parametre Aralığı | 1; 5; 10 | Yaprak oluşturmak için gereken en az servis sayısı aralığını belirtin |
| Kesir etiketleme aralığı | ParameterRangeSettings | [0.25;1.0] | mode:Parametre Aralığı | 0.25; 0.5; 0.75 | Her ağaç için eğitim verisi kesirlerinin aralığını belirtir |
| Özellik kesir aralığı | ParameterRangeSettings | [0.25;1.0] | mode:Parametre Aralığı | 0.25; 0.5; 0.75 | Her ağaç için kullanmak üzere özelliklerin kesirli (rastgele seçilen) aralığını belirtir |
| Bölme kesri aralığı | ParameterRangeSettings | [0.25;1.0] | mode:Parametre Aralığı | 0.25; 0.5; 0.75 | Her bölmede kullanmak üzere özelliklerin kesirli (rastgele seçilen) aralığını belirtir |
| Miktarları tahmin etmek için kullanılan örnek sayısı | Tamsayı | mode:Parametre Aralığı | 100 | Miktarları tahmin etmek için kullanılan örnek sayısı | |
| Gerekli miktar değerleri | Dize | mode:Parametre Aralığı | "0.25;0.5;0.75" | Parametre tarama sırasında kullanılan gerekli miktar değeri |
Çıkışlar
| Ad | Tür | Description |
|---|---|---|
| Eğitilmemiş model | ILearner arabirimi | Genel Modeli Eğit veya Modeli Çapraz Doğrula modüllerine bağlanan, eğitilmemiş bir quantile regresyon modeli. |