Aracılığıyla paylaş


Öğretici: Azure Machine Learning stüdyosu kod içermeyen AutoML ile sınıflandırma modeli eğitme

Bu öğreticide, Azure Machine Learning stüdyosu Azure Machine Learning kullanarak kod içermeyen otomatik makine öğrenmesi (AutoML) ile sınıflandırma modelini eğitmeyi öğreneceksiniz. Bu sınıflandırma modeli, bir müşterinin bir finansal kuruma sabit vadeli bir depozitoya abone olup olmadığını tahmin eder.

Otomatik ML ile zaman yoğun görevleri otomatikleştirebilirsiniz. Otomatik makine öğrenmesi, seçtiğiniz başarı ölçümünü temel alan en iyi modeli bulmanıza yardımcı olmak için birçok algoritma ve hiper parametre bileşimini hızla yineler.

Bu öğreticide kod yazmazsınız. Eğitim gerçekleştirmek için stüdyo arabirimini kullanırsınız. Aşağıdaki görevlerin nasıl yapılacağını öğrenirsiniz:

  • Azure Machine Learning çalışma alanı oluşturma
  • Otomatik makine öğrenmesi denemesi çalıştırma
  • Model ayrıntılarını keşfetme
  • Önerilen modeli dağıtma

Önkoşullar

  • Azure aboneliği. Azure aboneliğiniz yoksa ücretsiz hesap oluşturun.

  • bankmarketing_train.csv veri dosyasını indirin. y sütunu, bir müşterinin sabit vadeli bir depozitoya abone olup olmadığını belirtir. Bu, daha sonra bu öğreticideki tahminler için hedef sütun olarak tanımlanır.

    Not

    Bu Banka Pazarlama veri kümesi Creative Commons (CCO: Public Domain) Lisansı altında kullanıma sunulmuştur. Veritabanının tek tek içeriğindeki tüm haklar, Veritabanı İçeriği Lisansı kapsamında lisanslandırılır ve Kaggle'da kullanılabilir. Bu veri kümesi ilk olarak UCI Machine Learning Veritabanı'nın içinde kullanılabilirdi.

    [Moro ve diğerleri, 2014] S. Moro, P. Cortez ve P. Rita. Banka Telemarketing'in Başarısını Tahmin Etmek için Veri Odaklı Bir Yaklaşım. Karar Destek Sistemleri, Elsevier, 62:22-31, Haziran 2014.

Çalışma alanı oluşturma

Azure Machine Learning çalışma alanı, bulutta makine öğrenmesi modellerini denemek, eğitmek ve dağıtmak için kullandığınız temel bir kaynaktır. Azure aboneliğinizi ve kaynak grubunuzu hizmette kolayca kullanılan bir nesneye bağlar.

Çalışma alanı oluşturmak ve öğreticiye devam etmek için aşağıdaki adımları tamamlayın.

  1. Azure Machine Learning stüdyosu oturum açın.

  2. Çalışma alanı oluştur'u seçin.

  3. Yeni çalışma alanınızı yapılandırmak için aşağıdaki bilgileri sağlayın:

    Alan Açıklama
    Çalışma alanı adı Çalışma alanınızı tanımlayan benzersiz bir ad girin. Adların kaynak grubu genelinde benzersiz olması gerekir. Geri çağırması kolay bir ad kullanın ve başkaları tarafından oluşturulan çalışma alanlarından ayırt edin. Çalışma alanı adı büyük/küçük harfe duyarlı değildir.
    Abonelik Kullanmak istediğiniz Azure aboneliğini seçin.
    Kaynak grubu Aboneliğinizde mevcut kaynak gruplarından birini seçin veya bir ad girerek yeni bir kaynak grubu oluşturun. Kaynak grubu, Bir Azure çözümü için ilgili kaynakları barındırır. Mevcut bir kaynak grubunu kullanmak için katkıda bulunan veya sahip rolüne ihtiyacınız vardır. Daha fazla bilgi için bkz . Azure Machine Learning çalışma alanına erişimi yönetme.
    Bölge Çalışma alanınızı oluşturmak için kullanıcılarınıza en yakın Azure bölgesini ve veri kaynaklarını seçin.
  4. Çalışma alanını oluşturmak için Oluştur'u seçin.

Azure kaynakları hakkında daha fazla bilgi için bkz . Çalışma alanı oluşturma.

Azure'da çalışma alanı oluşturmanın diğer yolları için portalda veya Python SDK'sı (v2) ile Azure Machine Learning çalışma alanlarını yönetin.

Otomatik Makine Öğrenmesi işi oluşturma

aşağıdaki deneme kurulumunu tamamlayın ve konumundaki https://ml.azure.comAzure Machine Learning stüdyosu kullanarak adımları çalıştırın. Machine Learning Studio, tüm beceri düzeylerindeki veri bilimi uygulayıcıları için veri bilimi senaryoları gerçekleştirmek için makine öğrenmesi araçları içeren birleştirilmiş bir web arabirimidir. Stüdyo Internet Explorer tarayıcılarında desteklenmez.

  1. Aboneliğinizi ve oluşturduğunuz çalışma alanını seçin.

  2. Gezinti bölmesinde Otomatik ML Yazma'yı>seçin.

    Bu öğretici ilk otomatik ML denemeniz olduğundan boş bir liste ve belgelere bağlantılar görürsünüz.

    Yeni bir Otomatik ML işi oluşturabileceğiniz Otomatik ML sayfasını gösteren ekran görüntüsü.

  3. Yeni Otomatik ML işi'ni seçin.

  4. Eğitim yöntemi'nde Otomatik olarak eğit'i ve ardından İşi yapılandırmayı başlat'ı seçin.

  5. Temel ayarlar'da Yeni oluştur'u seçin, ardından Deneme adı için my-1st-automl-experiment girin.

  6. Veri kümenizi yüklemek için İleri'yi seçin.

Veri kümesi oluşturma ve veri varlığı olarak yükleme

Denemenizi yapılandırmadan önce veri dosyasını Azure Machine Learning veri varlığı biçiminde çalışma alanınıza yükleyin. Bu öğreticide bir veri varlığını Otomatik ML işi için veri kümeniz olarak düşünebilirsiniz. Bunu yaptığınızda, verilerinizin denemeniz için uygun şekilde biçimlendirildiğinden emin olursunuz.

  1. Görev türü & veriler bölümünde Görev türünü seçin için Sınıflandırma'yı seçin.

  2. Veri seç'in altında Oluştur'u seçin.

    1. Veri türü formunda, veri varlığınıza bir ad verin ve isteğe bağlı bir açıklama sağlayın.

    2. Tür için Tablosal'ı seçin. Otomatik ML arabirimi şu anda yalnızca TabularDatasets'i destekler.

    3. İleri'yi seçin.

    4. Veri kaynağı formunda Yerel dosyalardan'ı seçin. İleri'yi seçin.

    5. Hedef depolama türü'nde, çalışma alanı oluşturma işlemi sırasında otomatik olarak ayarlanan varsayılan veri depolarını seçin: workspaceblobstore. Veri dosyanızı çalışma alanınızda kullanılabilir hale getirmek için bu konuma yüklersiniz.

    6. İleri'yi seçin.

    7. Dosya veya klasör seçiminde Dosyaları veya klasörü>karşıya yükle Dosyaları karşıya yükle'yi seçin.

    8. Yerel bilgisayarınızda bankmarketing_train.csv dosyasını seçin. Bu dosyayı önkoşul olarak indirdiyseniz.

    9. İleri'yi seçin.

      Karşıya yükleme tamamlandığında, Veri önizleme alanı dosya türüne göre doldurulur.

    10. Ayarlar formunda verilerinizin değerlerini gözden geçirin. Sonra İleri'yi seçin.

      Alan Açıklama Öğreticinin değeri
      Dosya biçimi Bir dosyada depolanan verilerin düzenini ve türünü tanımlar. Sınırlandırılmış
      Sınırlayıcı Düz metin veya diğer veri akışlarında ayrı, bağımsız bölgeler arasındaki sınırı belirtmek için bir veya daha fazla karakter. Comma
      Kodlama Veri kümenizi okumak için hangi bit-karakter şeması tablosunun kullanılacağını tanımlar. UTF-8
      Sütun üst bilgileri Varsa, veri kümesinin üst bilgilerinin nasıl ele alınma şeklini gösterir. Tüm dosyaların üst bilgileri aynı
      Satırları atla Varsa, veri kümesinde kaç satırın atlanmış olduğunu gösterir. Hiçbiri
    11. Şema formu, bu deneme için verilerinizin daha fazla yapılandırılmasını sağlar. Bu örnekte, day_of_week dahil edilmemesi için iki durumlu düğmeyi seçin. İleri'yi seçin.

      Verilerinizden sütun ekleyebileceğiniz Şema formunu gösteren ekran görüntüsü.

    12. Gözden Geçir formunda bilgilerinizi doğrulayın ve oluştur'u seçin.

  3. Listeden veri kümenizi seçin.

  4. Veri varlığını seçip önizleme sekmesine bakarak verileri gözden geçirin. day_of_week içermediğinden emin olun ve Kapat'ı seçin.

  5. Görev ayarlarına devam etmek için İleri'yi seçin.

İşi yapılandırma

Verilerinizi yükleyip yapılandırdıktan sonra denemenizi ayarlayabilirsiniz. Bu kurulum, işlem ortamınızın boyutunu seçme ve tahmin etmek istediğiniz sütunu belirtme gibi deneme tasarım görevlerini içerir.

  1. Görev ayarları formunu aşağıdaki gibi doldurun:

    1. Tahmin etmek istediğiniz hedef sütun olarak y (Dize) öğesini seçin. Bu sütun, müşterinin bir dönem depozitosunun abone olup olmadığını gösterir.

    2. Ek yapılandırma ayarlarını görüntüle'yi seçin ve alanları aşağıdaki gibi doldurun. Bu ayarlar, eğitim işini daha iyi denetlemek için kullanılır. Aksi takdirde, varsayılanlar deneme seçimine ve verilere göre uygulanır.

      Ek yapılandırmalar Açıklama Öğreticinin değeri
      Birincil ölçüm Makine öğrenmesi algoritmasını ölçmek için kullanılan değerlendirme ölçümü. AUCWeighted
      En iyi modeli açıklama Otomatik ML tarafından oluşturulan en iyi modelde açıklanabilirliği otomatik olarak gösterir. Etkinleştir
      Engellenen modeller Eğitim işinden dışlamak istediğiniz algoritmalar Hiçbiri
    3. Kaydet'i seçin.

  2. Doğrula ve test et altında:

    1. Doğrulama türü için k katlanmış çapraz doğrulama'yı seçin.
    2. Çapraz doğrulama sayısı için 2'yi seçin.
  3. İleri'yi seçin.

  4. İşlem türünüz olarak işlem kümesi'ne tıklayın.

    İşlem hedefi, eğitim betiğinizi çalıştırmak veya hizmet dağıtımınızı barındırmak için kullanılan yerel veya bulut tabanlı bir kaynak ortamıdır. Bu deneme için bulut tabanlı sunucusuz işlem (önizleme) deneyebilir veya kendi bulut tabanlı işleminizi oluşturabilirsiniz.

    Not

    Sunucusuz işlem kullanmak için önizleme özelliğini etkinleştirin, Sunucusuz'a tıklayın ve bu yordamı atlayın.

  5. Kendi işlem hedefinizi oluşturmak için İşlem türünü seçin bölümünde İşlem kümesi'ne seçerek işlem hedefinizi yapılandırın.

  6. İşleminizi ayarlamak için Sanal Makine formunu doldurun. Yeni'yi seçin.

    Alan Açıklama Öğreticinin değeri
    Konum Makineyi çalıştırmak istediğiniz bölge Batı ABD 2
    Sanal makine katmanı Denemenizin hangi önceliğe sahip olması gerektiğini seçin Ayrılmış
    Sanal makine türü İşleminiz için sanal makine türünü seçin. CPU (Merkezi İşlem Birimi)
    Sanal makine boyutu İşleminizin sanal makine boyutunu seçin. Verilerinize ve deneme türünüz temelinde önerilen boyutların listesi sağlanır. Standard_DS12_V2
  7. İleri'yi seçerek Gelişmiş Ayarlar formuna gidin.

    İşlem kümeniz için değerleri girdiğiniz Gelişmiş Ayarlar sayfasını gösteren ekran görüntüsü.

    Alan Açıklama Öğreticinin değeri
    İşlem adı İşlem bağlamınızı tanımlayan benzersiz bir ad. automl-compute
    Min / Max düğümleri Verilerin profilini belirlemek için 1 veya daha fazla düğüm belirtmeniz gerekir. En küçük düğümler: 1
    En fazla düğüm sayısı: 6
    Ölçeği azaltmadan önce boşta kalan saniyeler Küme otomatik olarak en düşük düğüm sayısına ölçeklendirilmeden önce boşta kalma süresi. 120 (varsayılan)
    Gelişmiş ayarlar Denemeniz için bir sanal ağı yapılandırma ve yetkilendirme ayarları. Hiçbiri
  8. Oluştur'u belirleyin.

    İşlem oluşturma işleminin tamamlanması dakikalar sürebilir.

  9. Oluşturma işleminden sonra listeden yeni işlem hedefinizi seçin. İleri'yi seçin.

  10. Denemeyi çalıştırmak için Eğitim işini gönder'i seçin. Genel Bakış ekranı açılır ve deneme hazırlığı başlarken üst kısımda Durum gösterilir. Deneme ilerledikçe bu durum güncelleştirilir. Denemenizin durumu hakkında sizi bilgilendirmek için stüdyoda bildirimler de görüntülenir.

Önemli

Deneme çalıştırmasının hazırlanması 10-15 dakika sürer. Çalıştırıldıktan sonra, her yineleme için 2-3 dakika daha fazla sürer.

Üretimde muhtemelen biraz uzaklaşırsınız. Ancak bu öğreticide, diğerleri çalışmaya devam ederken modeller sekmesinde test edilen algoritmaları keşfetmeye başlayabilirsiniz.

Modelleri keşfetme

Algoritmaların (modellerin) test edilmiş olduğunu görmek için Modeller + alt işler sekmesine gidin. varsayılan olarak, iş modelleri tamamlandıklarında ölçüm puanına göre sıralar. Bu öğreticide, seçilen AUCWeighted ölçümüne göre en yüksek puanı alan model listenin en üstünde yer alır.

Tüm deneme modellerinin tamamlanmasını beklerken tamamlanan modelin algoritma adını seçerek performans ayrıntılarını inceleyin. İş hakkında bilgi için Genel Bakış'ı ve Ölçümler sekmelerini seçin.

Aşağıdaki animasyonda seçilen modelin özellikleri, ölçümleri ve performans grafikleri gösterilir.

Bir alt iş için kullanılabilen farklı görünümleri gösteren animasyon.

Model açıklamalarını görüntüleme

Modellerin tamamlanmasını beklerken, model açıklamalarına da göz atabilir ve belirli bir modelin tahminlerini hangi veri özelliklerinin (ham veya mühendislik) etkilediğini görebilirsiniz.

Bu model açıklamaları isteğe bağlı olarak oluşturulabilir. Açıklamalar (önizleme) sekmesinin parçası olan model açıklamaları panosu bu açıklamaları özetler.

Model açıklamaları oluşturmak için:

  1. Sayfanın üst kısmındaki gezinti bağlantılarında, modeller ekranına dönmek için iş adını seçin.

  2. Modeller + alt işler sekmesini seçin.

  3. Bu öğretici için ilk MaxAbsScaler, LightGBM modelini seçin.

  4. Modeli açıkla'ya tıklayın. Sağ tarafta Modeli açıkla bölmesi görüntülenir.

  5. İşlem türünüzü seçin ve ardından daha önce oluşturduğunuz örneği veya kümeyi seçin: automl-compute . Bu işlem, model açıklamalarını oluşturmak için bir alt iş başlatır.

  6. Oluştur'u belirleyin. Yeşil bir başarı iletisi görüntülenir.

    Not

    Açıklanabilirlik işinin tamamlanması yaklaşık 2-5 dakika sürer.

  7. Açıklamalar (önizleme) öğesini seçin. Bu sekme, açıklanabilirlik çalıştırması tamamlandıktan sonra doldurulur.

  8. Sol tarafta bölmeyi genişletin. Özellikler'in altında ham yazan satırı seçin.

  9. Toplama özelliği önem derecesi sekmesini seçin. Bu grafik, seçilen modelin tahminlerini etkileyen veri özelliklerini gösterir.

    Toplam özellik önem grafiğini görüntüleyen Model açıklaması panosunu gösteren ekran görüntüsü.

    Bu örnekte, sürenin bu modelin tahminleri üzerinde en fazla etkiye sahip olduğu görülmektedir.

En iyi modeli dağıtma

Otomatik makine öğrenmesi arabirimi, web hizmeti olarak en iyi modeli dağıtmanıza olanak tanır. Dağıtım , modelin tümleştirilmesidir, böylece yeni veriler hakkında tahminde bulunabilir ve olası fırsat alanlarını belirleyebilir. Bu deneme için bir web hizmetine dağıtım, finansal kurumun artık olası sabit dönemli depozito müşterilerini tanımlamak için yinelemeli ve ölçeklenebilir bir web çözümüne sahip olduğu anlamına gelir.

Deneme çalıştırmanızın tamamlanıp tamamlanmadığını denetleyin. Bunu yapmak için, ekranınızın üst kısmındaki iş adını seçerek üst iş sayfasına geri dönün. Ekranın sol üst kısmında Tamamlandı durumu gösterilir.

Deneme çalıştırması tamamlandıktan sonra Ayrıntılar sayfası En iyi model özeti bölümüyle doldurulur. Bu deneme bağlamında VotingEnsemble, AUCWeighted ölçümüne göre en iyi model olarak kabul edilir.

Bu modeli dağıtın. Dağıtımın tamamlanması yaklaşık 20 dakika sürer. Dağıtım işlemi modeli kaydetme, kaynak oluşturma ve bunları web hizmeti için yapılandırma gibi çeşitli adımları içerir.

  1. Modele özgü sayfayı açmak için VotingEnsemble öğesini seçin.

  2. Web hizmetini dağıt'ı>seçin.

  3. Model dağıtma bölmesini aşağıdaki gibi doldurun:

    Alan Değer
    Veri Akışı Adı my-automl-deploy
    Açıklama İlk otomatik makine öğrenmesi denemesi dağıtımım
    İşlem türü Azure Container Instance'ı seçin
    Kimlik doğrulamayı etkinleştir Devre Dışı.
    Özel dağıtım varlıklarını kullanma Devre Dışı. Varsayılan sürücü dosyasının (puanlama betiği) ve ortam dosyasının otomatik olarak üretilmesine izin verir.

    Bu örnek için Gelişmiş menüsünde sağlanan varsayılan değerleri kullanın.

  4. Dağıt'ı seçin.

    İş ekranının üst kısmında yeşil bir başarı iletisi görüntülenir. Model özeti bölmesinde, Durumu dağıt'ın altında bir durum iletisi görüntülenir. Dağıtım durumunu denetlemek için Düzenli aralıklarla yenile'yi seçin.

Tahmin oluşturmak için işletimsel bir web hizmetiniz var.

Yeni web hizmetinizi kullanma hakkında daha fazla bilgi edinmek ve Azure Machine Learning'de yerleşik Power BI desteği kullanarak tahminlerinizi test etmek için İlgili içeriğe geçin.

Kaynakları temizleme

Dağıtım dosyaları veri ve deneme dosyalarından daha büyük olduğundan depolama maliyeti daha yüksektir. Çalışma alanınızı ve deneme dosyalarınızı korumak istiyorsanız, hesabınıza maliyetleri en aza indirmek için yalnızca dağıtım dosyalarını silin. Dosyalardan hiçbirini kullanmayı planlamıyorsanız kaynak grubunun tamamını silin.

Dağıtım örneğini silme

Azure Machine Learning'den şu konumdan yalnızca dağıtım örneğini silin: https://ml.azure.com/.

  1. Azure Machine Learning'e gidin. Çalışma alanınıza gidin ve Varlıklar bölmesinin altında Uç Noktalar'ı seçin.

  2. Silmek istediğiniz dağıtımı seçin ve Sil'i seçin.

  3. Devam Et'i seçin.

Kaynak grubunu silme

Önemli

Oluşturduğunuz kaynaklar, diğer Azure Machine Learning öğreticileri ve nasıl yapılır makaleleri için önkoşul olarak kullanılabilir.

Oluşturduğunuz kaynaklardan hiçbirini kullanmayı planlamıyorsanız, ücret ödememek için bunları silin:

  1. Azure portalındaki arama kutusuna Kaynak grupları yazın ve sonuçlardan seçin.

  2. Listeden, oluşturduğunuz kaynak grubunu seçin.

  3. Genel Bakış sayfasında Kaynak grubunu sil'i seçin.

    Azure portalında kaynak grubunu silme seçimlerinin ekran görüntüsü.

  4. Kaynak grubu adını girin. Ardından Sil'i seçin.

Bu otomatik makine öğrenmesi öğreticisinde, sınıflandırma modeli oluşturmak ve dağıtmak için Azure Machine Learning'in otomatik ML arabirimini kullandınız. Daha fazla bilgi ve sonraki adımlar için şu kaynaklara bakın:

Bu diğer model türleri için otomatik makine öğrenmesini de deneyin: