Share via


Model Hiper Parametrelerini Ayarlama

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

En uygun parametre ayarlarını belirleyebilmek için modelde bir parametre süpüruygular

kategori: Machine Learning/eğitme

Not

uygulama hedefi: yalnızca Machine Learning Studio (klasik)

benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.

Modüle genel bakış

bu makalede, belirli bir makine öğrenimi modelinin en uygun hiper parametrelerini öğrenmek için Machine Learning Studio 'da (klasik) ayarlama modeli hiper parametreleri modülünün nasıl kullanılacağı açıklanır. Modül, farklı ayar bileşimleri kullanarak birden çok modeli oluşturur ve sınar ve ayarların birleşimini almak için ölçümleri tüm modeller üzerinde karşılaştırır.

Terms parametresi ve hyperparameter kafa karıştırıcı olabilir. Modelin parametreleri Özellikler bölmesinde ayarladığınız şeydir. Temel olarak, bu modül belirtilen parametre ayarları üzerinde bir parametre tarama gerçekleştirir ve belirli bir karar ağacı, veri kümesi veya gerileme yöntemi için farklı olabilecek en iyi hiper parametrekümesini öğrenir. En iyi yapılandırmayı bulma işlemi bazen ayarlamaolarak adlandırılır.

Modül, bir modelin en iyi ayarlarını bulmak için iki yöntemi destekler:

  • Tümleşik eğitim ve ayarlama: kullanılacak parametre kümesini yapılandırır ve ardından modülün birden fazla kombinasyon üzerinde yineleme yapmasına izin verir ve bu da "en iyi" modeli bulana kadar doğruluğu ölçmenize olanak tanır. En öğrenner modülleri sayesinde, eğitim süreci sırasında hangi parametrelerin değiştirilmesi gerektiğini ve ne sabit kalması gerektiğini seçebilirsiniz.

    Ayarlama işleminin ne kadar süreyle çalışmasını istediğinize bağlı olarak, tüm birleşimleri ayrı test etmeye karar verebilir veya parametre birleşimlerinin bir kılavuzunu oluşturarak ve parametre kılavuzunun rastgele bir alt kümesini test ederek işlemi kısaltabilirsiniz.

  • Ayarlama Ile çapraz doğrulama: Bu seçenekle, verilerinizi biraz katlara böler ve ardından her katda modeller oluşturup test edersiniz. Bu yöntem en iyi doğruluğu sağlar ve veri kümesiyle ilgili sorunları bulmaya yardımcı olabilir; Ancak, daha uzun bir süre sonra eğitme sürer.

Her iki yöntem de yeniden kullanmak için kaydedebilmeniz gereken eğitilen bir model oluşturur.

  • Bir kümeleme modeli oluşturuyorsanız, en uygun küme sayısını ve diğer parametreleri otomatik olarak belirleyebilmek için tarama Kümelemesi ' ni kullanın.

  • Ayarlamadan önce, en yüksek bilgi değerine sahip sütunları veya değişkenleri ayarlamak için özellik seçimini uygulayın. Daha fazla bilgi için bkz. Özellik seçimi.

Ayarlama modeli hiper parametrelerini yapılandırma

Genellikle, belirli bir makine öğrenimi modelinin en iyi hiper parametrelerini öğrenirken önemli deneme gerekir. Bu modül, test modeli doğruluğunu test etmek için hem ilk ayarlama sürecini hem de çapraz doğrulamayı destekler:

Parametre süpürme kullanarak bir modeli eğitme

Bu bölümde, model hiper parametreleri ayarla modülünü kullanarak bir modeli gösteren temel bir parametre süpürme gerçekleştirme açıklanmaktadır.

  1. Service model Hyperparameters modülünü Studio 'daki denemenize (klasik) ekleyin.

  2. eğitimli olmayan bir model ( ilearner biçimindeki bir model) en soldaki girişe Bağlan.

  3. Değişken Oluşturucu Oluştur seçeneğini parametre aralığına ayarlayın ve parametre süpürme içinde kullanılacak bir değer aralığı belirtmek için Aralık oluşturucusunu kullanın.

    Neredeyse tüm Sınıflandırma ve regresyon modülleri tümleşik bir parametre süpürmesini destekler. Bir parametre aralığı yapılandırmayı desteklemeyen öğrenenlere yönelik olarak yalnızca kullanılabilir parametre değerleri test edilebilir.

    Bir veya daha fazla parametre için değeri el ile ayarlayabilir ve ardından kalan parametrelerin üzerinde tarama yapabilirsiniz. Bu işlem biraz zaman kazandırabilir.

  4. Eğitim için kullanmak istediğiniz veri kümesini ekleyin ve bunu ayarlama modeli hiper parametrelerininorta girişine bağlayın.

    İsteğe bağlı olarak, etiketli bir veri kümeniz varsa, bunu en sağdaki giriş bağlantı noktasına (Isteğe bağlı doğrulama veri kümesi) bağlayabilirsiniz. Bu, eğitim ve ayarlama sırasında doğruluğu ölçmenize olanak tanır.

  5. Model hiper parametrelerinin ayarla' nın Özellikler bölmesinde, parametre swemoduiçin bir değer seçin. Bu seçenek parametrelerin nasıl seçili olduğunu denetler.

    • Tüm ızgara: Bu seçeneği belirlediğinizde, modül, sistem tarafından önceden tanımlanmış bir kılavuz üzerinde döngü gerçekleştirerek farklı birleşimler deneyebilir ve en iyi öğrenme kimliğini belirler. Bu seçenek, en iyi parametre ayarlarının ne olabileceğini ve tüm olası değer birleşimini denemek istediğinizi bilmeyen durumlar için yararlıdır.

    Ayrıca kılavuzun boyutunu küçültebilir ve rastgele bir ızgara süpürme çalıştırabilirsiniz. Araştırma, bu yöntemin aynı sonuçlara neden olduğunu, ancak daha verimli bir hesaplama olduğunu göstermiştir.

    • Rastgele tarama: Bu seçeneği belirlediğinizde modül, sistem tarafından tanımlanan bir aralıktaki parametre değerlerini rastgele seçer. Modülün yürütmesini istediğiniz en fazla çalıştırma sayısını belirtmeniz gerekir. Bu seçenek, tercih ettiğiniz ölçümleri kullanarak model performansını artırmak istediğiniz, ancak bilgi işlem kaynaklarını sürdürmeye devam eden durumlar için yararlıdır.
  6. Etiket sütunuiçin, tek bir etiket sütunu seçmek üzere sütun seçiciyi başlatın.

  7. Modelleri derecelendirerek kullanılacak tek bir ölçüm seçin.

    Bir parametre süpürme çalıştırdığınızda model türü için geçerli tüm ölçümler hesaplanır ve tarama sonuçları raporunda döndürülür. Ayrı ölçümler, regresyon ve sınıflandırma modelleri için kullanılır.

    Ancak, seçtiğiniz ölçüm modellerin derecelendirme şeklini belirler. Yalnızca, seçili ölçüm tarafından derecelendirilen en üst model, Puanlama için kullanılacak eğitilen bir model olarak çıktı.

  8. Rastgele çekirdekiçin, parametre süpürme başlatılırken kullanılacak bir sayı yazın.

    Tümleşik bir parametre süpüryi destekleyen bir modelde eğitim yapıyorsanız, kullanılacak bir çekirdek değerleri aralığı da ayarlayabilirsiniz ve ayrıca rastgele çekirdekler üzerinde de yineleme yapabilirsiniz. Bu, çekirdek seçimine göre tanıtılan sapmaktan kaçınmak için yararlı olabilir.

  9. Denemeyi çalıştırın.

Hiper parametre ayarlama sonuçları

Eğitim tamamlandığında:

  • En iyi modelin doğruluk ölçümleri kümesini görüntülemek için modüle sağ tıklayın, tarama sonuçları' nı seçin ve ardından Görselleştir' i seçin.

    Model türü için geçerli olan tüm doğruluk ölçümleri çıkışlardır, ancak sıralama için seçtiğiniz ölçüm hangi modelin "en iyi" kabul edileceğini belirler. Ölçümler yalnızca üst dereceye sahip model için oluşturulur.

  • "En iyi" modeli için türetilmiş ayarları görüntülemek için, modüle sağ tıklayın, eğitilen en iyi modeliseçin ve ardından Görselleştir' e tıklayın. Rapor, giriş sütunlarının parametre ayarlarını ve özellik ağırlıklarını içerir.

  • Diğer denemeleri içinde Puanlama için modeli kullanmak üzere, ayarlama işlemini tekrarlamanız gerekmeden model çıktısına sağ tıklayıp eğitilen model olarak kaydet' i seçin.

Bir parametre süpürme ile çapraz doğrulama gerçekleştirme

Bu bölüm, çapraz doğrulama ile bir parametre süpürme nasıl birleştirileceğini açıklar. Bu işlem daha uzun sürer, ancak katların sayısını belirtebilir ve veri kümeniz ve olası modeller hakkındaki maksimum bilgi miktarını alabilirsiniz.

  1. Deneymenize bölüm ve örnek modülünü ekleyin ve eğitim verilerini bağlayın.

  2. Katlara ata seçeneğini belirleyin ve verileri bölmek için bazı katların sayısını belirtin. Bir sayı belirtmezseniz, varsayılan olarak 10 katlar kullanılır. Satırlar, değişiklik yapılmadan rastgele olarak bu katlara eklenir.

  3. Bir sütundaki örneklemeyi dengelemek için, dikey bölmeyidoğruolarak ayarlayın ve ardından konuşmasıyla Strata sütununuseçin. Örneğin, imleleküme veri kümeniz varsa, veri kümesini her katın aynı sayıda minlık durumu almasını sağlayan şekilde bölmek isteyebilirsiniz.

  4. Deneme uygulamanıza ayarlama modeli hiper parametreleri modülünü ekleyin.

  5. bu kategorideki makine öğrenimi modüllerinden birini, ayar modeli hiper parametrelerininsol taraftaki girdisine Bağlan.

  6. Öğrenici için Özellikler bölmesinde, bir çöp modu oluştur seçeneğini parametre aralığına ayarlayın ve parametre süpürme içinde kullanılacak bir değer aralığı belirtmek için Aralık Oluşturucu 'yu kullanın.

    Tüm değerler için bir Aralık belirtmeniz gerekmez. Bazı parametrelerin değerini el ile ayarlayabilir ve ardından kalan parametrelerin üzerinde tarama yapabilirsiniz. Bu işlem biraz zaman kazandırabilir.

    Bu seçeneği desteklemeyen öğrenenler listesi için bkz. Teknik notlar bölümü.

  7. bölüm ve örnek çıktısını, ayar modeli hiper parametrelerininetiketli eğitim veri kümesi girdisine Bağlan.

  8. İsteğe bağlı olarak, bir doğrulama veri kümesini ayarlama modeli hiper parametrelerininen sağdaki girdisine bağlayabilirsiniz. Çapraz doğrulama için yalnızca bir eğitim veri kümesine ihtiyacınız vardır.

  9. Model hiper parametrelerinin ayarla' nın Özellikler bölmesinde, rastgele bir tarama veya kılavuz tarama gerçekleştirmek isteyip istemediğinizi belirtin. Bir ızgara tarama, çok daha fazla zaman alır. Rastgele bir parametre araması, çok fazla zaman almadan iyi sonuçlar elde edebilir.

    Rastgele taramada en fazla çalıştırma sayısı: Rastgele bir tarama seçerseniz, parametre değerlerinin rastgele birleşimini kullanarak modelin kaç kez eğitilmeleri gerektiğini belirtebilirsiniz.

    Rastgele kılavuzda en fazla çalıştırma sayısı: Bu seçenek, parametre değerlerinin rastgele örneklemesi üzerinde yineleme sayısını da kontrol eder, ancak değerler belirtilen aralıktan rastgele oluşturulmaz; bunun yerine, parametre değerlerinin tüm olası birleşimlerini bir matris oluşturulur ve matris üzerinde rastgele bir örnekleme alınır. Bu yöntem bölgesel fazla örnekleme veya alt örnekleme için daha verimli ve daha azdır.

    İpucu

    Bu seçenekler hakkında daha ayrıntılı bilgi için Teknik notlar bölümüne bakın.

  10. Tek etiketli bir sütun seçin.

  11. Modeli derecelendirmek için tek bir ölçüm seçin. Birçok ölçüm hesaplanır, bu nedenle sonuçları sıralamak için en önemli ölçümü seçin.

  12. Rastgele çekirdek için, parametre taramayı başlatma sırasında kullanmak üzere bir sayı yazın.

    Tümleşik parametre taramayı destekleyen bir model eğitirsiniz, ayrıca kullanmak üzere bir dizi çekirdek değeri ayarleyip rastgele çekirdekler üzerinde de yinelersiniz. Bu isteğe bağlıdır, ancak çekirdek seçimiyle ortaya sızan sapmaları önlemek için yararlı olabilir.

  13. Modeli Çapraz Doğrulama modülünü ekleyin. Bağlan ve Örnek çıkışını Veri Kümesi girişine ve Tune Model Hyperparameters çıkışını Eğitilmemiş model girişine bağlayın.

  14. Denemeyi çalıştırın.

Çapraz doğrulama sonuçları

Çapraz doğrulama tamamlandığında:

  • Değerlendirme sonuçlarını görüntülemek için modüle sağ tıklayın, Katlama ile değerlendirme sonuçları'nın ardından Görselleştir'i seçin.

    Doğruluk ölçümleri çapraz doğrulama geçişlerinden hesaplanır ve seçtiğiniz katlara bağlı olarak biraz farklılık gösterebilir.

  • Veri kümesine nasıl bölündüklerini ve "en iyi" modelin veri kümesinde her satırı nasıl puanlay olduğunu görmek için modüle sağ tıklayın, Puanlı sonuçlar'ı seçin ve ardından Görselleştir'i seçin.

  • Bu veri kümesi daha sonra yeniden kullanmak üzere kaydedilse de kat atamaları korunur. Örneğin, kaydedilen datsaet şu şekilde olabilir:

    Atamaları katlama Sınıf Age(1. özellik sütunu)
    2 0 35
    1 1 17
    3 0 62
  • "En iyi" modelin parametre ayarlarını almak için Model Hiper Parametrelerini Ayarla'ya sağ tıklayın

Örnekler

Bu modülün nasıl kullanıldıklarının örnekleri için bkz . Azure Yapay Zeka Galerisi:

  • Öğrenci performansı tahmini: Mümkün olan en iyi kök ortalama hata karesi (RMSE) ile bir model oluşturmak için farklı parametrelerle İki Sınıflı Artırlı Karar Ağacı algoritmasını kullanır.

  • Learning: İkili Sınıflandırma: Sayı tabanlı öğrenme kullanarak küçük bir özellik kümesi üretir ve ardından en iyi model parametrelerini bulmak için bir parametre tarama uygular.

  • İkili Sınıflandırma: Ağa izinsiz giriş algılama: İki Sınıflı Lojistik Regresyon modeli için en iyi hiperparametreleri bulmak üzere modeli ayarlama hiperparametrelerini çapraz doğrulama modunda, beş kat özel olarak bölünmüş şekilde kullanır.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

Parametre tarama nasıl çalışır?

Bu bölümde parametre taramanın genel olarak nasıl çalıştığını ve bu modülde yer alan seçeneklerin nasıl etkileşimde bulunarak etkileşim kurduğu açıkmektedir.

Parametre taramayı ayarladığınız zaman, rastgele seçilen sonlu sayıda parametreyi veya tanımladığınız bir parametre alanı üzerinde kapsamlı bir arama kullanmak için arama kapsamınızı tanımlarsiniz.

  • Rastgele tarama: Bu seçenek, bir modeli bir dizi yineleme kullanarak eğiter.

    Tekrar etmek için bir değer aralığı belirtirsiniz ve modül bu değerlerin rastgele seçilen bir alt kümesini kullanır. Değerler değiştirme ile seçilir, yani daha önce rastgele seçilen sayılar kullanılabilir sayı havuzundan kaldırılamaz. Bu nedenle, herhangi bir değerin seçilme şansı tüm geçişlerde aynı kalır.

  • Kılavuz tarama: Bu seçenek, belirttiğiniz değer aralığındaki parametrelerin her birleşimini içeren bir matris veya kılavuz oluşturur. Bu modülle ayarlamaya başsanız, bu parametrelerin bileşimleri kullanılarak birden çok model eğitiliyor.

  • Kılavuzun tamamı: Kılavuzun tamamını kullanma seçeneği şu anlama gelir: her birleşim ve her birleşim test edilir. Bu seçenek en kapsamlı seçenek olarak kabul edilir, ancak en çok zaman gerektirir.

  • Rastgele kılavuz: Bu seçeneği belirlerseniz tüm birleşimlerin matrisi hesaplanır ve değerler, belirttiğiniz yineleme sayısı üzerinden matristen örnekleme yapılır.

    Son araştırmalar, rastgele taramaların kılavuz taramaları yerine daha iyi performans göstere olduğunu göstermiştir.

Eğitimin uzunluğunu ve karmaşıklığını denetleme

Birçok ayar bileşimini tekrarlama işlemi zaman alabilir, bu nedenle modül işlemi sınırlamak için çeşitli yollar sağlar:

  • Modeli test etmek için kullanılan yineleme sayısını sınırlama
  • Parametre alanı sınırlama
  • Yinelemelerin hem de parametre alanı sayılarının ikisini de sınırla

Belirli bir veri kümesi ve model üzerinde en verimli eğitim yöntemini belirlemek için ayarlarla denemeler yapın.

Değerlendirme ölçümü seçme

Her modelin doğruluğunu içeren bir rapor en sonunda sunulmaktadır, böylece ölçüm sonuçlarını gözden geçirebilirsiniz. Tüm sınıflandırma modelleri için tekdüdüz bir ölçüm kümesi, regresyon modellerinde ise farklı bir ölçüm kümesi kullanılır. Ancak eğitim sırasında, ayarlama işlemi sırasında oluşturulan modelleri derecelendirmek için tek bir ölçüm seçmeniz gerekir. İş problemnize ve hatalı pozitiflerin ve hatalı negatiflerin maliyetine bağlı olarak en iyi ölçümün farklı olduğunu bulabilirsiniz.

Daha fazla bilgi için bkz. Machine Learning'da model performansını değerlendirme

Sınıflandırma için kullanılan ölçümler

  • Doğru -luk Gerçek sonuçların toplam durumlara oranı.

  • Hassas Gerçek sonuçların pozitif sonuçlara oranı.

  • Hatırla Tüm sonuçlar üzerinde tüm doğru sonuçların kesri.

  • F puanı Duyarlık ve geri çağırmayı dengeler.

  • AUC X ekseninde hatalı pozitif sonuçlar çizilen ve gerçek pozitifler y ekseninde çizilen eğrinin altındaki alanı temsil eden bir değer.

  • Ortalama Günlük Kaybı İki olasılık dağılımı arasındaki fark: gerçek dağılım ve modelde bir tane.

  • Günlük Kaybını Eğitin Model tarafından rastgele bir tahmin üzerinde sağlanan geliştirme.

Regresyon için kullanılan ölçümler

  • Ortalama mutlak hata Modelde tüm hatanın ortalamasını alır; burada hata, tahmin edilen değerin gerçek değerden uzaklığı anlamına gelir. Genellikle MAE olarak kısaltıldı.

  • Ortalama hata karesi kökü Hataların karelerinin ortalamasını ölçür ve ardından bu değerin kökünü alır. Genellikle RMSE olarak kısaltıldı

  • Göreli mutlak hata Hatayı, gerçek değerin yüzdesi olarak temsil eder.

  • Göreli hata karesi Tahmin edilen değerlerin toplam hata karesi değerine bölerek toplam hata karesi değerini normalleştirin.

  • Belirleme katsayısı Verilerin modele ne kadar uygun olduğunu gösteren tek bir sayı. 1 değeri, modelin veriyle tam olarak eş değere sahip olduğu anlamına gelir; 0 değeri, verilerin rastgele olduğu veya modele başka bir şekilde sığmayabilecek olduğu anlamına gelir. Genellikle r2, R2 veya r karesi olarak adlandırılır.

Parametre taramayı desteklemeen modüller

Machine Learning tüm öğrenciler, denemeler için parametreleri seçmenize olanak sağlayan tümleşik parametre tarama ile çapraz doğrulamayı destekler. Öğrenciler bir değer aralığı ayarlamayı desteklemezse yine de çapraz doğrulamada kullanabilirsiniz. Bu durumda, tarama için bazı izin verilen değerler aralığı seçilir.

Aşağıdaki öğrenciler parametre taramada kullanmak üzere bir değer aralığı ayarlamayı desteklemez:

Beklenen girişler

Ad Tür Description
Eğitilmemiş model ILearner arabirimi Parametre tarama için eğitilmemiş model
Eğitim veri kümesi Veri Tablosu Eğitim için giriş veri kümesi
Doğrulama veri kümesi Veri tablosu Doğrulama için giriş veri kümesi (eğitim ve test doğrulama modu için). Bu girdi isteğe bağlıdır.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Parametre swemodunu belirtin Liste Tarama yöntemleri Rastgele tarama Parametre alanında kılavuzun tamamını süpürme veya sınırlı sayıda örnek çalıştırma kullanarak süpürme
Rastgele tarama sırasında en fazla çalıştırma sayısı [1; 10000] Tamsayı 5 Rastgele süpürme kullanarak en fazla çalıştırma sayısını yürütün
Rastgele çekirdek herhangi biri Tamsayı 0 Rastgele sayı oluşturucuyu temel almak için bir değer girin
Etiket sütunu herhangi biri ColumnSelection Etiket sütunu
Sınıflandırma performansını ölçmek için ölçüm Liste İkili sınıflandırma ölçüm türü Veritabanınızın Sınıflandırma modellerini değerlendirmek için kullanılan ölçümü seçin
Gerileme performansını ölçmek için ölçüm Liste Gerilesionmetrik türü Ortalama mutlak hata Regresyon modellerini değerlendirmek için kullanılan ölçümü seçin

Çıkışlar

Ad Tür Description
Tarama sonuçları Veri tablosu Parametre tarama çalıştırmaları için sonuç ölçümü
Eğitilen en iyi model ILearner arabirimi Eğitim veri kümesinde en iyi performansa sahip model

Ayrıca bkz.

A-Z modül listesi
Eğitim
Çapraz doğrulama modeli