Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Karar ormanı algoritmasını kullanarak çok sınıflı sınıflandırma modeli oluşturur
Kategori: Machine Learning / Modeli Başlatma / Sınıflandırma
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle genel bakış
Bu makalede, karar ormanı algoritmasını temel alan bir makine öğrenmesi modeli oluşturmak için Machine Learning Studio'da (klasik) Çok Sınıflı Karar Ormanı modülünün nasıl kullanımı açıklanmıştır. Karar ormanı, etiketli verilerden öğrenerek çok hızlı bir şekilde bir dizi karar ağacını biriktiren grup modelidir.
Karar ormanları hakkında daha fazla bilgi
Karar ormanı algoritması, sınıflandırma için bir grup öğrenme yöntemidir. Algoritma, birden çok karar ağacını oluşturur ve ardından en popüler çıkış sınıfını oylar. Oylama, sınıflandırma karar ormanında bulunan her ağacın normalleştirilmiş olmayan bir sıklık histogramı olarak etiket çıkışı yaptığı bir toplama biçimidir. Toplama işlemi bu histogramları toplar ve her etiket için "olasılıkları" almak için sonucu normalleştirmektedir. Tahmin güveni yüksek olan ağaçlar, topluluğun son kararına göre daha fazla ağırlık verir.
Karar ağaçları genel olarak asimetrik olmayan modellerdir ve bu da farklı dağılımlara sahip verileri desteklemektedir. Her ağaçta, her sınıf için bir dizi basit test çalıştırılıyor ve bir yaprak düğüme (karar) ulaşıncaya kadar ağaç yapısının düzeyleri artırılıyor.
Karar ağaçlarının birçok avantajı vardır:
- Doğrusal olmayan karar sınırlarını temsil ediyor olabilir.
- Eğitim ve tahmin sırasında hesaplama ve bellek kullanımı açısından verimlidir.
- Tümleşik özellik seçimi ve sınıflandırması gerçekleştirler.
- Bu özellikler gürültülü özelliklerin varlığına karşı daha fazla sahiptir.
Machine Learning Studio'daki karar ormanı sınıflandırıcısı (klasik) bir karar ağacı grubudan oluşur. Grup modelleri genellikle tek karar ağaçlarına göre daha iyi kapsam ve doğruluk sağlar. Daha fazla bilgi için bkz. Karar ağaçları.
Çok Sınıflı Karar Ormanı'nın yapılandırılması
İpucu
En iyi parametrelerden emin değilsanız, birden çok modeli eğitmek ve test etmek ve en uygun parametreleri bulmak için Model Ayarlama Hiper parametreleri modülünü kullanmanız önerilir.
Studio'da (klasik) denemenize Çok Sınıflı Karar Ormanı modülünü ekleyin. Bu modülü Machine Learning, Modeli Başlatve Sınıflandırma altındabulabilirsiniz.
Özellikler bölmesini açmak için modüle çift tıklayın.
Yeniden örnekleme yöntemi için tek tek ağaçları oluşturmak için kullanılan yöntemi seçin. Etiketleme veya çoğaltmayı seçebilirsiniz.
Etiketleme: Etiketleme bootstrap toplama olarak da ifade eder. Bu yöntemde, özgün veri kümesi boyutuna sahip bir veri kümesine sahip olana kadar her ağaç, özgün veri kümesinde rastgele örnekleme ve değiştirme ile oluşturulan yeni bir örnekte oluşturulur. Modellerin çıkışları bir toplama biçimi olan oylama ile bir araya gelir. Daha fazla bilgi için Bootstrap toplama için Wikipedia girdisi'ne bakın.
Çoğaltma: Çoğaltmada her ağaç tam olarak aynı giriş verileri üzerinde eğitılır. Her ağaç düğümü için hangi bölmenin kullanılırı belirlemesi rastgele kalır ve çeşitli ağaçlar oluşturulur.
Rehberlik için Çok Sınıflı Karar Ormanı Modeli Yapılandırma bölümüne bakın.
Eğitimci modu oluştur seçeneğini ayarerek modelin nasıl eğitilsin?
Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız ve bağımsız değişken olarak bir değer kümesi sağlamak için bu seçeneği belirleyin.
Parametre Aralığı: En iyi parametrelerden emin değilseniz ve parametre tarama kullanmak istemiyorsanız bu seçeneği kullanın.
Karar ağacı sayısı: Grup içinde oluşturulacak en fazla karar ağacı sayısını yazın. Daha fazla karar ağacı oluşturarak daha iyi kapsama sahip olabilirsiniz, ancak eğitim süresi artabilir.
Bu değer, eğitilen modeli görselleştirerek sonuçlarda görüntülenen ağaç sayısını da kontrol eder. Tek bir ağacı görmek veya yazdırmak için değeri 1 olarak ayarlayın; ancak bu, yalnızca bir ağacın (ilk parametre kümesine sahip ağaç) üretilile bir ağaç olduğu ve başka bir yineleme gerçekleştirilenen anlamına gelir.
Karar ağaçlarının maksimum derinliği: Herhangi bir karar ağacının maksimum derinliğini sınırlamak için bir sayı yazın. Ağacın derinliğini artırmak, fazla çalışma ve eğitim süresi riskiyle karşıtlığı artırabilir.
Düğüm başına rastgele bölme sayısı: Ağacın her düğümünü inşa etmek için kullanabileceğiniz bölme sayısını yazın. Bölme , ağacın (düğümün) her düzeyindeki özelliklerin rastgele bölündükleri anlamına gelir.
Yaprak düğüm başına en az örnek sayısı: Bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az örnek sayısını gösterir. Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın.
Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir.
Kategorik özellikler için bilinmeyen değerlere izin ver: Eğitim veya doğrulama kümelerini bilinmeyen değerler için bir grup oluşturmak için bu seçeneği belirleyin. Model, bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.
Bu seçeneğin seçimini kaldırsanız, model yalnızca eğitim verisinde mevcut olan değerleri kabul eder.
Bağlan bir datset ve eğitim modüllerinden birini kullanın:
Eğitimci modu oluştur'a TekParametre olarak ayarlanırsa Modeli Eğit modülünü kullanın.
Eğitmen modu oluştur seçeneğini Parametre Aralığı olarak ayarlarsanız Modeli Ayarlama Hiper parametreleri modülünü kullanın. Bu seçenekle, eğitmen ayarların birden çok bileşimini tekrarlar ve en iyi modeli üreten parametre değerlerini belirler.
Not
Modeli Eğit'e bir parametre aralığı iletirsiniz, parametre aralığı listesinde yalnızca ilk değeri kullanır.
Model Ayarlama Hiperparametreleri modülüne tek bir parametre değeri kümesi iletirsiniz; her parametre için bir dizi ayar bekliyorsa, değerleri yoksayır ve öğrenciler için varsayılan değerleri kullanır.
Parametre Aralığı seçeneğini belirtir ve herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile, belirttiğiniz tek değer tarama boyunca kullanılır.
Denemeyi çalıştırın.
Sonuçlar
Eğitim tamamlandıktan sonra:
- Her yinelemede oluşturulan ağacı görmek için Modeli Eğitma modülü'ne sağ tıklayın ve görselleştirilen model'i seçin. Model Ayarlama HiperParametrelerini kullanıyorsanız modüle sağ tıklayın ve en iyi modeli görselleştirmek için Eğitilen en iyi model'i seçin. Her düğümün kurallarını görmek için bölmelerde detaya inecek ağaçlara tıklayın.
Örnekler
Karar ormanlarının makine öğrenmesinde nasıl kullanıldıklarına ilişkin örnekler için bkz . Azure Yapay Zeka Galerisi:
- Çok Sınıflı Sınıflandırıcıları Karşılaştırma örneği: Çeşitli algoritmalar kullanır ve bunların artılarını ve dezavantajlarını açıklar.
Teknik notlar
Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.
Uygulama ayrıntıları
Sınıflandırma karar ormanında bulunan her ağaç, normalleştirilmiş olmayan bir etiket sıklığı histogramı oluşturur. Toplama, bu histogramları toplama ve her etiket için "olasılıkları" almak için normalleştirmedir. Bu şekilde, tahmin güveni yüksek olan ağaçlar, topluluğun son kararına daha fazla ağırlık verir.
İlgili araştırma
Çoğalt seçeneğiyle eğitim süreci hakkında daha fazla bilgi için bkz:
Çok Sınıflı Karar Ormanı Modelini Yapılandırma
Modülün çok az veri veya eğitim için sınırlı süre gibi senaryolara uyum sağlayacak şekilde yapılandırılması yolunu değiştirebilirsiniz.
Sınırlı eğitim süresi
Eğitim kümesi çok sayıda örnek içeriyorsa ancak modeli eğitebilirsiniz ancak bu süre sınırlı ise şu seçenekleri kullanmayı deneyin:
- Daha az sayıda karar ağacı (örneğin, 5-10) kullanan bir karar ormanı oluşturun.
- Yeniden örnekleme için Çoğalt seçeneğini kullanın.
- Düğüm başına daha az sayıda rastgele bölme belirtin (örneğin, 100'den az).
Sınırlı eğitim kümesi
Eğitim kümesi sınırlı sayıda örnek içeriyorsa şu seçenekleri kullanmayı deneyin:
- Çok sayıda karar ağacı (örneğin, 20'den fazla) kullanan bir karar ormanı oluşturun.
- Yeniden örnekleme için Etiketleme seçeneğini kullanın.
- Düğüm başına çok sayıda rastgele bölme belirtin (örneğin, 1.000'den fazla).
Modül parametreleri
| Name | Aralık | Tür | Varsayılan | Description |
|---|---|---|---|---|
| Yeniden örnekleme yöntemi | Herhangi biri | ResamplingMethod | Torbalama | Yeniden örnekleme yöntemi seçme: Etiketleme veyaÇoğaltma |
| Karar ağacı sayısı | >=1 | Tamsayı | 8 | Grup içinde oluşturulan karar ağacı sayısını belirtin |
| Karar ağaçlarının maksimum derinliği | >=1 | Tamsayı | 32 | Oluşturulacak karar ağacının maksimum derinliğini belirtin |
| Düğüm başına rastgele bölme sayısı | >=1 | Tamsayı | 128 | Düğüm başına oluşturulan ve en uygun bölmenin seçilecek bölme sayısını belirtin |
| Yaprak düğüm başına en az örnek sayısı | >=1 | Tamsayı | 1 | Yaprak düğüm oluşturmak için gereken en az eğitim örneği sayısını belirtin |
| Kategorik özellikler için bilinmeyen değerlere izin ver | Herhangi biri | Boole | Doğru | Mevcut kategorik özelliklerin bilinmeyen değerlerinin yeni ve ek bir özellikle eşlenmiş olup olmadığını gösterir |
Çıkışlar
| Ad | Tür | Description |
|---|---|---|
| Eğitilmemiş model | ILearner arabirimi | Eğitilmemiş çok sınıflı sınıflandırma modeli |
Ayrıca bkz.
Sınıflandırma
İki Sınıflı Karar Ormanı
Karar Ormanı Regresyonu
A-Z Modül Listesi