Öğretici 2: Kredi riski modellerini eğitme - Machine Learning Studio (klasik)

Makale
02/11/2019

ŞUNLAR IÇIN GEÇERLIDIR: Bu bir onay işaretidir ve bu da bu makalenin Machine Learning Studio (klasik) için geçerli olduğu anlamına gelir. Machine Learning Studio (klasik) Bu bir X değeridir ve bu makalenin Azure Machine Learning için geçerli olmadığı anlamına gelir. Azure Machine Learning

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning'e taşıma hakkındaki bilgilere bakın.
Azure Machine Learning hakkında daha fazla bilgi edinin

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu öğreticide, tahmine dayalı analiz çözümü geliştirme sürecine genişletilmiş bir bakış sunarsınız. Machine Learning Studio'da (klasik) basit bir model geliştirirsiniz. Ardından modeli Machine Learning web hizmeti olarak dağıtırsınız. Dağıtılan bu model, yeni verileri kullanarak tahminlerde bulunabilir. Bu öğretici, üç bölümden oluşan bir öğretici serisinin ikinci bölümüdür.

Bir kişinin kredi başvurusunda verdiği bilgilere dayanarak kredi riskini tahmin etmeniz gerektiğini varsayalım.

Kredi riski değerlendirmesi karmaşık bir sorundur, ancak bu öğretici bunu biraz basitleştirir. Bunu, Machine Learning Studio (klasik) kullanarak tahmine dayalı analiz çözümü oluşturma örneği olarak kullanacaksınız. Bu çözüm için Machine Learning Studio (klasik) ve Bir Machine Learning web hizmeti kullanacaksınız.

Bu üç bölümlü öğreticide, genel kullanıma açık kredi riski verileriyle başlayacaksınız. Ardından tahmine dayalı bir model geliştirip eğitebilirsiniz. Son olarak modeli bir web hizmeti olarak dağıtırsınız.

Öğreticinin birinci bölümünde bir Machine Learning Studio (klasik) çalışma alanı oluşturdunuz, verileri karşıya yüklediyseniz ve bir deneme oluşturdunuz.

Öğreticinin bu bölümünde:

Birden çok modeli eğitin
Modelleri puanlayıp değerlendirin

Öğreticinin üçüncü bölümünde modeli web hizmeti olarak dağıtacaksınız.

Önkoşullar

Öğreticinin birinci bölümünü tamamlayın.

Birden çok modeli eğitin

Makine öğrenmesi modelleri oluşturmak için Machine Learning Studio'yu (klasik) kullanmanın avantajlarından biri, tek bir denemede aynı anda birden fazla model türünü deneyip sonuçları karşılaştırmaktır. Bu tür denemeler, sorununuz için en iyi çözümü bulmanıza yardımcı olur.

Bu öğreticide geliştirdiğimiz denemede iki farklı model türü oluşturacak ve ardından puanlama sonuçlarını karşılaştırarak son denememizde hangi algoritmayı kullanmak istediğinize karar vereceksiniz.

Aralarından seçim yapabileceğiniz çeşitli modeller vardır. Kullanılabilir modelleri görmek için modül paletindeki Machine Learning düğümünü genişletin ve ardından Modeli Başlat'ı ve altındaki düğümleri genişletin. Bu denemenin amaçları doğrultusunda, İki Sınıflı Destek Vektör Makinesi (SVM) ve İki Sınıflı Artırılmış Karar Ağacı modüllerini seçeceksiniz.

Bu denemede hem İki Sınıflı Artırılmış Karar Ağacı modülünü hem de İki Sınıflı Destek Vektör Makinesi modülünü ekleyeceksiniz.

İki Sınıflı Artırmalı Karar Ağacı

İlk olarak, artırılmış karar ağacı modelini ayarlayın.

Modül paletinde İki Sınıflı Artırılmış Karar Ağacı modülünü bulun ve tuvale sürükleyin.
Modeli Eğitme modülünü bulun, tuvale sürükleyin ve ardından İki Sınıflı Artırılmış Karar Ağacı modülünün çıkışını Modeli Eğitme modülünün sol giriş bağlantı noktasına bağlayın.

İki Sınıflı Artırılmış Karar Ağacı modülü genel modeli başlatır ve Modeli Eğit, modeli eğitmek için eğitim verilerini kullanır.
Sol R Betiği Yürütme modülünün sol çıkışını Modeli Eğit modülünün sağ giriş bağlantı noktasına bağlayın (bu öğreticide eğitim için Verileri Bölme modülünün sol tarafından gelen verileri kullandınız).

İpucu

Bu deneme için iki girişe ve R Betiği Yürütme modülünün çıktılarından birine ihtiyacınız yoktur, böylece bunları eksiz bırakabilirsiniz.

Denemenin bu bölümü şu şekilde görünür:

Model eğitma

Şimdi Modeli Eğit modülüne modelin Kredi Riski değerini tahmin etmelerini istediğinizi söylemeniz gerekir.

Modeli Eğit modülünü seçin. Özellikler bölmesinde Sütun seçiciyi başlat'a tıklayın.
Tek sütun seçin iletişim kutusunda, Kullanılabilir Sütunlar'ın altındaki arama alanına "kredi riski" yazın, aşağıdaki "Kredi riski" öğesini seçin ve "Kredi riski" öğesini Seçili Sütunlar'a taşımak için sağ ok düğmesine (>) tıklayın.
Tamam onay işaretine tıklayın.

İki Sınıflı Destek Vektör Makinesi

Ardından SVM modelini ayarlarsınız.

İlk olarak, SVM hakkında küçük bir açıklama. Artırılmış karar ağaçları her tür özellik ile iyi çalışır. Ancak, SVM modülü doğrusal bir sınıflandırıcı oluşturduğundan, oluşturduğu model tüm sayısal özellikler aynı ölçeğe sahip olduğunda en iyi test hatasına sahiptir. Tüm sayısal özellikleri aynı ölçeğe dönüştürmek için bir "Tanh" dönüştürmesi kullanırsınız (Verileri Normalleştirme modülüyle). Bu, sayılarımızı [0,1] aralığına dönüştürür. SVM modülü, dize özelliklerini kategorik özelliklere ve ardından ikili 0/1 özelliklerine dönüştürür, böylece dize özelliklerini el ile dönüştürmeniz gerekmez. Ayrıca, Kredi Riski sütununu (sütun 21) dönüştürmek istemezsiniz; bu sayısaldır, ancak modeli tahmin etmek için eğitdiğimiz değerdir, bu nedenle bunu yalnız bırakmanız gerekir.

SVM modelini ayarlamak için aşağıdakileri yapın:

Modül paletinde İki Sınıflı Destek Vektör Makinesi modülünü bulun ve tuvale sürükleyin.
Modeli Eğit modülüne sağ tıklayın, Kopyala'yı seçin ve ardından tuvale sağ tıklayıp Yapıştır'ı seçin. Modeli Eğit modülünün kopyası, özgün ile aynı sütun seçimine sahiptir.
İki Sınıflı Destek Vektör Makinesi modülünün çıkışını ikinci Eğitim Modeli modülünün sol giriş bağlantı noktasına bağlayın.
Verileri Normalleştirme modülünü bulun ve tuvale sürükleyin.
Soldaki R Betiği Yürütme modülünün sol çıkışını bu modülün girişine bağlayın (modülün çıkış bağlantı noktasının birden fazla modüle bağlı olabileceğine dikkat edin).
Verileri Normalleştirme modülünün sol çıkış bağlantı noktasını ikinci Modeli Eğit modülünün sağ giriş bağlantı noktasına bağlayın.

Denememizin bu bölümü şimdi şöyle görünmelidir:

İkinci modeli eğitma

Şimdi Verileri Normalleştirme modülünü yapılandırın:

Verileri Normalleştir modülünü seçmek için tıklayın. Özellikler bölmesinde Dönüştürme yöntemi parametresi için Tanh öğesini seçin.
Sütun seçiciyi başlat'a tıklayın, Başlangıç Için "Sütun yok" seçeneğini belirleyin, ilk açılan listede Ekle'yi seçin, ikinci açılan listeden sütun türünü seçin ve üçüncü açılan listeden Sayısal'ı seçin. Bu, tüm sayısal sütunların (ve yalnızca sayısal) dönüştürüldüğünü belirtir.
Bu satırın sağındaki artı işaretine (+) tıklayın; bu, bir açılan liste satırı oluşturur. İlk açılan listede Dışla'yı seçin, ikinci açılan listeden sütun adlarını seçin ve metin alanına "Kredi riski" yazın. Bu, Kredi Riski sütununun yoksayılması gerektiğini belirtir (bunu yapmanız gerekir çünkü bu sütun sayısaldır ve dışlamadıysanız dönüştürülebilir).
Tamam onay işaretine tıklayın.

Verileri Normalleştirme modülü artık Kredi Riski sütunu dışındaki tüm sayısal sütunlarda Tanh dönüşümü gerçekleştirecek şekilde ayarlanmıştır.

Modelleri puanlayıp değerlendirin

Eğitilen modellerimizin puanını almak için Verileri Bölme modülüyle ayrılmış test verilerini kullanırsınız. Daha sonra, hangi modelin daha iyi sonuçlar ürettiğini görmek için iki modelin sonuçlarını karşılaştırabilirsiniz.

Model Puanla modüllerini ekleme

Model Puanla modülünü bulun ve tuvale sürükleyin.
İki Sınıflı Artırılmış Karar Ağacı modülüne bağlı Modeli Eğit modülünü Modeli Puanla modülünün sol giriş bağlantı noktasına bağlayın.
Modeli Puanla modülünün doğru giriş bağlantı noktasına doğru R Betiği Yürütme modülünü (test verilerimiz) bağlayın.

Modeli Puanla modülü artık test verilerinden kredi bilgilerini alabilir, modelde çalıştırabilir ve modelin oluşturduğu tahminleri test verilerindeki gerçek kredi riski sütunuyla karşılaştırabilir.
İkinci bir kopya oluşturmak için Modeli Puanla modülünü kopyalayıp yapıştırın.
SVM modelinin çıkışını (yani, İki Sınıflı Destek Vektör Makinesi modülüne bağlı Modeli Eğit modülünün çıkış bağlantı noktası) ikinci Model Puanla modülünün giriş bağlantı noktasına bağlayın.
SVM modeli için, eğitim verilerine yaptığınız gibi test verilerine de dönüştürmeniz gerekir. Bu nedenle ikinci bir kopya oluşturmak ve bunu doğru R Betiği Yürütme modülüne bağlamak için Verileri Normalleştirme modülünü kopyalayıp yapıştırın.
İkinci Verileri Normalleştirme modülünün sol çıkışını ikinci Model Puanla modülünün sağ giriş bağlantı noktasına bağlayın.

Modeli Değerlendirme modülünü ekleme

İki puanlama sonucunu değerlendirmek ve karşılaştırmak için modeli değerlendirme modülünü kullanırsınız.

Modeli Değerlendirme modülünü bulun ve tuvale sürükleyin.
Artırılmış karar ağacı modeliyle ilişkili Modeli Puanla modülünün çıkış bağlantı noktasını Modeli Değerlendir modülünün sol giriş bağlantı noktasına bağlayın.
Diğer Puan Modeli modülünü doğru giriş bağlantı noktasına bağlayın.

Denemeyi çalıştırma ve sonuçları denetleme

Denemeyi çalıştırmak için tuvalin altındaki ÇALıŞTıR düğmesine tıklayın. Bu işlem birkaç dakika sürebilir. Her modülde dönen bir gösterge çalıştığını ve ardından modülün ne zaman tamamlandığını gösteren yeşil bir onay işareti gösterir. Tüm modüllerin onay işareti olduğunda denemenin çalışması tamamlanmıştır.

Deneme şu şekilde görünmelidir:

Her iki modeli de değerlendirme

Sonuçları denetlemek için Modeli Değerlendir modülünün çıkış bağlantı noktasına tıklayın ve Görselleştir'i seçin.

Modeli Değerlendirme modülü, puanlanan iki modelin sonuçlarını karşılaştırmanıza olanak sağlayan bir çift eğri ve ölçüm oluşturur. Sonuçları Alıcı İşleci Özelliği (ROC) eğrileri, Duyarlık/Geri Çekme eğrileri veya Lift eğrileri olarak görüntüleyebilirsiniz. Görüntülenen ek veriler arasında karışıklık matrisi, eğrinin altındaki alan için kümülatif değerler (AUC) ve diğer ölçümler yer alır. Kaydırıcıyı sola veya sağa taşıyarak eşik değerini değiştirebilir ve ölçüm kümesini nasıl etkilediğini görebilirsiniz.

Grafiğin sağındaki Puanlanan veri kümesi veya Puanlanan veri kümesi'ne tıklayarak ilişkili eğriyi vurgulamak ve ilişkili ölçümleri aşağıda görüntülemek için karşılaştırın. Eğrilerin göstergesinde "Puanlanan veri kümesi", Modeli Değerlendirme modülünün sol giriş bağlantı noktasına karşılık gelir; bizim örneğimizde bu, artırılmış karar ağacı modelidir. "Karşılaştıracak puanlanan veri kümesi", doğru giriş bağlantı noktasına (bizim örneğimizdeki SVM modeli) karşılık gelir. Bu etiketlerden birine tıkladığınızda, bu modelin eğrisi vurgulanır ve aşağıdaki grafikte gösterildiği gibi ilgili ölçümler görüntülenir.

Modeller için ROC eğrileri

Bu değerleri inceleyerek, aradığınız sonuçları size vermeye en yakın modeli seçebilirsiniz. Farklı modellerdeki parametre değerlerini değiştirerek denemenize geri dönebilir ve denemenizde yineleme yapabilirsiniz.

Bu sonuçları yorumlama ve model performansını ayarlama bilimi ve sanatı bu öğreticinin kapsamı dışındadır. Ek yardım için aşağıdaki makaleleri okuyabilirsiniz:

İpucu

Denemeyi her çalıştırdığınızda bu yinelemenin kaydı Çalıştırma Geçmişi'nde tutulur. Tuvalin altındaki ÇALıŞTıRMA GEÇMİşİ GÖRÜNTÜLE'ye tıklayarak bu yinelemeleri görüntüleyebilir ve bunlardan herhangi birine dönebilirsiniz. Ayrıca Özellikler bölmesinde Önceki Çalıştırma'ya tıklayarak, açtığınız yinelemeden hemen önceki yinelemeye dönebilirsiniz.

Tuvalin altındaki FARKLı KAYDET'e tıklayarak denemenizin herhangi bir yinelemesinin kopyasını oluşturabilirsiniz. Deneme yinelemelerinizde denediğiniz işlemlerin kaydını tutmak için denemenin Özet ve Açıklama özelliklerini kullanın.

Daha fazla bilgi için bkz . Machine Learning Studio'da (klasik) deneme yinelemelerini yönetme.

Kaynakları temizleme

Bu makaleyi kullanarak oluşturduğunuz kaynaklara artık ihtiyacınız yoksa ücret ödememek için bunları silin. Ürün içi kullanıcı verilerini dışarı aktarma ve silme makalesinde nasıl yapılacağını öğrenin.

Sonraki adımlar

Bu öğreticide şu adımları tamamladınız:

Deneme oluşturma
Birden çok modeli eğitin
Modelleri puanlayıp değerlendirin

Artık bu veriler için model dağıtmaya hazırsınız.

Öğretici 3 - Modelleri dağıtma

Aracılığıyla paylaş