AutoML'de zaman serisi tahmini için düzensiz özellikler

Bu makalede, AutoML'nin regresyon modellerini tahmin etme için gecikme ve sıralı pencere toplama özellikleri oluşturma yöntemlerine odaklanmaktadır. Geçmiş bilgileri kullanan bu özellikler, modelin zaman içindeki bağıntısal desenleri öğrenmesine yardımcı olarak doğruluğu önemli ölçüde artırabilir. AutoML'de tahmin metodolojisi hakkında genel bilgi için yöntemlere genel bakış makalesine bakın. AutoML'deki eğitim tahmin modellerine yönelik yönergeler ve örnekler , zaman serisi tahmini için AutoML'yi ayarlama makalemizde bulunabilir.

Gecikme özelliği örneği

AutoML, tahmin ufkunu dikkate alan gecikmeler oluşturur. Bu bölümdeki örnekte bu kavram gösterilmektedir. Burada üç tahmin ufku ve bir hedef gecikme sırası kullanacağız. Aşağıdaki aylık zaman serisini göz önünde bulundurun:

Tablo 1: Özgün zaman serisi

Tarih $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

İlk olarak yalnızca ufuk $h=1$ için gecikme özelliğini oluşturacağız. Okumaya devam ettikçe, her tabloda neden tek tek ufukları kullandığımız netleşir.

Tablo 2: $h=1$ için gecikme özelliği

Tarih $y_t$ Kaynak $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

Tablo 2, $y_t$ sütununu tek bir gözlemle aşağı kaydırarak Tablo 1'den oluşturulur. Gecikme özelliklerinin kaynaklandığı tarihleri içeren adlı Origin bir sütun ekledik. Ardından, yalnızca tahmin ufku $h=2$ için gecikme özelliğini oluşturacağız.

Tablo 3: $h=2$ için gecikme özelliği

Tarih $y_t$ Kaynak $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

Tablo 3, $y_t$ sütununu iki gözlem aşağı kaydırarak Tablo 1'den oluşturulur. Son olarak, yalnızca tahmin ufku $h=3$ için gecikme özelliğini oluşturacağız.

Tablo 4: $h=3$ için gecikme özelliği

Tarih $y_t$ Kaynak $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Ardından, Tablo 1, 2 ve 3'i birleştirip satırları yeniden düzenleyeceğiz. Sonuç aşağıdaki tabloda yer alır:

Tablo 5: Gecikme özelliği tamamlandı

Tarih $y_t$ Kaynak $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

Son tabloda, gecikme sütununun adını $y_{t-1}^{(h)}$ olarak değiştirerek gecikmenin belirli bir ufka göre oluşturulduğunu yansıtacağız. Tablo, ufuk açısından oluşturduğumuz gecikmelerin önceki tablolarda gecikme oluşturmanın geleneksel yöntemleriyle eşlenebileceğini göstermektedir.

Tablo 5, AutoML'nin regresyon modellerinden doğrudan tahmine olanak tanımak için eğitim verilerine uyguladığı veri artırmaya bir örnektir. Yapılandırmada gecikme özellikleri olduğunda AutoML, tamsayı değerli ufuk özelliğiyle birlikte ufuk bağımlı gecikmeler oluşturur. Bu, AutoML'nin tahmin regresyon modellerinin, ARIMA gibi özyinelemeli olarak tanımlanmış modellerin aksine, $h-1$ değerindeki tahmine bakılmaksızın horizon $h$ düzeyinde tahminde bulunmasını sağlar.

Not

Ufuk bağımlı gecikme özelliklerinin oluşturulması, veri kümesine yeni satırlar ekler. Yeni satır sayısı tahmin ufkuyla orantılıdır. Bu veri kümesi boyutunun büyümesi, daha küçük işlem düğümlerinde veya veri kümesi boyutu zaten büyük olduğunda bellek yetersiz hatalarına yol açabilir. Bu sorunun çözümleri için sık sorulan sorular makalesine bakın.

Bu gecikme stratejisinin bir diğer sonucu da gecikme sırası ve tahmin ufkunun birbirinden ayrılmış olmasıdır. Örneğin, tahmin ufkunuz yedi ise ve AutoML'nin gecikme özelliklerini kullanmasını istiyorsanız, tam tahmin ufku üzerinde tahmin sağlamak için gecikme sırasını yedi olarak ayarlamanız gerekmez. AutoML ufuk açısından gecikmeler oluşturduğundan, gecikme sırasını bir olarak ayarlayabilirsiniz ve AutoML verileri genişleterek herhangi bir sıranın gecikmelerinin tahmin ufku kadar geçerli olmasını sağlar.

Sonraki adımlar