Aracılığıyla paylaş


AutoML'de tahmin için model süpürme ve seçim

Bu makalede, Azure Machine Learning'deki otomatik makine öğrenmesi (AutoML) tahmin modellerini nasıl arar ve seçer açıklanmaktadır. AutoML'deki tahmin metodolojisi hakkında daha fazla bilgi edinmek istiyorsanız bkz . AutoML'de tahmin yöntemlerine genel bakış. AutoML'de modelleri tahmin etmeye yönelik eğitim örneklerini keşfetmek için bkz . SDK ve CLI ile zaman serisi tahmin modelini eğitmek için AutoML'yi ayarlama.

AutoML'de model süpürme

AutoML için temel görev, çeşitli modelleri eğitmek ve değerlendirmek ve verilen birincil ölçüme göre en iyi olanı seçmektir. Bu durumda "model" sözcüğü hem ARIMA veya Rastgele Orman gibi model sınıfını hem de bir sınıf içindeki modelleri ayıran belirli hiper parametre ayarlarını ifade eder. Örneğin, ARIMA bir matematiksel şablonu ve bir dizi istatistiksel varsayımı paylaşan bir model sınıfına başvurur. AriMA modelini eğitme veya sığdırma, modelin kesin matematiksel biçimini belirten pozitif tamsayıların listesini gerektirir. Bu değerler hiper parametrelerdir. ARIMA(1, 0, 1) ve ARIMA(2, 1, 2) modelleri aynı sınıfa ancak farklı hiper parametrelere sahiptir. Bu tanımlar eğitim verilerine ayrı ayrı sığabilir ve birbirlerine karşı değerlendirilebilir. AutoML, hiper parametreleri değiştirerek farklı model sınıflarında ve sınıflar içinde aramalar veya süpürmeler.

Hiper parametre süpürme yöntemleri

Aşağıdaki tabloda AutoML'nin farklı model sınıfları için kullandığı farklı hiper parametre süpürme yöntemleri gösterilmektedir:

Model sınıf grubu Model türü Hiper parametre süpürme yöntemi
Naive, MevsimSel Naive, Ortalama, Mevsimsel Ortalama Zaman serisi Model basitliği nedeniyle sınıf içinde süpürme yok
Üstel Düzeltme, ARIMA(X) Zaman serisi Sınıf içi süpürme için kılavuz araması
Peygamber Regresyon Sınıf içinde süpürme yok
Doğrusal SGD, LARS LASSO, Elastik Ağ, K En Yakın Komşular, Karar Ağacı, Rastgele Orman, Aşırı Rastgele Ağaçlar, Gradyan Artırılmış Ağaçlar, LightGBM, XGBoost Regresyon AutoML'nin model öneri hizmeti hiper parametre alanlarını dinamik olarak keşfeder
ForecastTCN Regresyon Statik model listesi ve ardından ağ boyutu, bırakma oranı ve öğrenme oranı üzerinden rastgele arama

Farklı model türlerinin açıklaması için tahmin yöntemlerine genel bakış makalesinin AutoML'de tahmin modelleri bölümüne bakın.

AutoML'nin süpürme miktarı tahmin işi yapılandırmasına bağlıdır. Durdurma ölçütlerini bir süre sınırı veya deneme sayısı sınırı veya eşdeğer model sayısı olarak belirtebilirsiniz. Birincil ölçüm iyileştirilmiyorsa, süpürmeyi durdurmak için her iki durumda da erken sonlandırma mantığı kullanılabilir.

AutoML'de model seçimi

AutoML, tahmin modellerini aramak ve seçmek için üç aşamalı bir işlem izler:

  • 1. Aşama: Zaman serisi modellerini tarayın ve en yüksek olasılık tahmin yöntemlerini kullanarak her sınıftan en iyi modeli seçin.

  • 2. Aşama: Regresyon modellerini süpürme ve doğrulama kümelerindeki birincil ölçüm değerlerine göre 1. aşamadaki en iyi zaman serisi modelleriyle birlikte bunları sırala.

  • 3. Aşama: En üst sıradaki modellerden bir grup modeli oluşturun, doğrulama ölçümünü hesaplayın ve diğer modellerle sıralayın.

3. aşamanın sonunda en yüksek dereceli ölçüm değerine sahip model en iyi model olarak belirlenmiştir.

Önemli

3. Aşamada AutoML her zaman modellere uymayan örnek dışı verilerdeki ölçümleri hesaplar. Bu yaklaşım aşırı sığdırmaya karşı korunmaya yardımcı olur.

Doğrulama yapılandırmaları

AutoML iki doğrulama yapılandırmasına sahiptir: çapraz doğrulama ve açık doğrulama verileri.

Çapraz doğrulama durumunda AutoML, eğitim ve doğrulama katlarına veri bölmeleri oluşturmak için giriş yapılandırmasını kullanır. Zaman sırası bu bölmelerde korunmalıdır. AutoML, bir kaynak zaman noktası kullanarak seriyi eğitim ve doğrulama verilerine bölen Sıralı Çıkış Noktası Çapraz Doğrulama adını kullanır. Kaynağın zaman içinde kaydırlanması çapraz doğrulama katlamalarını oluşturur. Her doğrulama katlama, verilen katlama için çıkış noktasının konumunun hemen ardından gözlemlerin bir sonraki ufkunu içerir. Bu strateji, zaman serisi veri bütünlüğünü korur ve bilgi sızıntısı riskini azaltır.

Çapraz doğrulama adım boyutuna göre eğitim ve doğrulama kümelerini ayıran çapraz doğrulama katlamalarını gösteren diyagram.

AutoML, her katlamada ayrı bir model eğiterek ve tüm katlamalardan ortalama doğrulama ölçümlerini uygulayarak her zamanki çapraz doğrulama yordamını izler.

Tahmin işleri için çapraz doğrulama, çapraz doğrulama katlamalarının sayısı ve isteğe bağlı olarak iki ardışık çapraz doğrulama katlama arasındaki zaman aralığı sayısı ayarlanarak yapılandırılır. Daha fazla bilgi ve tahmin için çapraz doğrulama yapılandırma örneği için bkz . Özel çapraz doğrulama ayarları.

Kendi doğrulama verilerinizi de getirebilirsiniz. Daha fazla bilgi için bkz . AutoML'de eğitim, doğrulama, çapraz doğrulama ve test verilerini yapılandırma (SDK v1).