AutoML'de zaman serisi tahmini için düzensiz özellikler
Bu makalede, AutoML'nin regresyon modellerini tahmin etme için gecikme ve sıralı pencere toplama özellikleri oluşturma yöntemlerine odaklanmaktadır. Geçmiş bilgileri kullanan bu özellikler, modelin zaman içindeki bağıntısal desenleri öğrenmesine yardımcı olarak doğruluğu önemli ölçüde artırabilir. AutoML'de tahmin metodolojisi hakkında genel bilgi için yöntemlere genel bakış makalesine bakın. AutoML'deki eğitim tahmin modellerine yönelik yönergeler ve örnekler , zaman serisi tahmini için AutoML'yi ayarlama makalemizde bulunabilir.
Gecikme özelliği örneği
AutoML, tahmin ufkunu dikkate alan gecikmeler oluşturur. Bu bölümdeki örnekte bu kavram gösterilmektedir. Burada üç tahmin ufku ve bir hedef gecikme sırası kullanacağız. Aşağıdaki aylık zaman serisini göz önünde bulundurun:
Tarih | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
İlk olarak yalnızca ufuk $h=1$ için gecikme özelliğini oluşturacağız. Okumaya devam ettikçe, her tabloda neden tek tek ufukları kullandığımız netleşir.
Tablo 2: $h=1$ için gecikme özelliği
Tarih | $y_t$ | Kaynak | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
Tablo 2, $y_t$ sütununu tek bir gözlemle aşağı kaydırarak Tablo 1'den oluşturulur. Gecikme özelliklerinin kaynaklandığı tarihleri içeren adlı Origin
bir sütun ekledik. Ardından, yalnızca tahmin ufku $h=2$ için gecikme özelliğini oluşturacağız.
Tablo 3: $h=2$ için gecikme özelliği
Tarih | $y_t$ | Kaynak | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
Tablo 3, $y_t$ sütununu iki gözlem aşağı kaydırarak Tablo 1'den oluşturulur. Son olarak, yalnızca tahmin ufku $h=3$ için gecikme özelliğini oluşturacağız.
Tablo 4: $h=3$ için gecikme özelliği
Tarih | $y_t$ | Kaynak | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Ardından, Tablo 1, 2 ve 3'i birleştirip satırları yeniden düzenleyeceğiz. Sonuç aşağıdaki tabloda yer alır:
Tablo 5: Gecikme özelliği tamamlandı
Tarih | $y_t$ | Kaynak | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Son tabloda, gecikme sütununun adını $y_{t-1}^{(h)}$ olarak değiştirerek gecikmenin belirli bir ufka göre oluşturulduğunu yansıtacağız. Tablo, ufuk açısından oluşturduğumuz gecikmelerin önceki tablolarda gecikme oluşturmanın geleneksel yöntemleriyle eşlenebileceğini göstermektedir.
Tablo 5, AutoML'nin regresyon modellerinden doğrudan tahmine olanak tanımak için eğitim verilerine uyguladığı veri artırmaya bir örnektir. Yapılandırmada gecikme özellikleri olduğunda AutoML, tamsayı değerli ufuk özelliğiyle birlikte ufuk bağımlı gecikmeler oluşturur. Bu, AutoML'nin tahmin regresyon modellerinin, ARIMA gibi özyinelemeli olarak tanımlanmış modellerin aksine, $h-1$ değerindeki tahmine bakılmaksızın horizon $h$ düzeyinde tahminde bulunmasını sağlar.
Not
Ufuk bağımlı gecikme özelliklerinin oluşturulması, veri kümesine yeni satırlar ekler. Yeni satır sayısı tahmin ufkuyla orantılıdır. Bu veri kümesi boyutunun büyümesi, daha küçük işlem düğümlerinde veya veri kümesi boyutu zaten büyük olduğunda bellek yetersiz hatalarına yol açabilir. Bu sorunun çözümleri için sık sorulan sorular makalesine bakın.
Bu gecikme stratejisinin bir diğer sonucu da gecikme sırası ve tahmin ufkunun birbirinden ayrılmış olmasıdır. Örneğin, tahmin ufkunuz yedi ise ve AutoML'nin gecikme özelliklerini kullanmasını istiyorsanız, tam tahmin ufku üzerinde tahmin sağlamak için gecikme sırasını yedi olarak ayarlamanız gerekmez. AutoML ufuk açısından gecikmeler oluşturduğundan, gecikme sırasını bir olarak ayarlayabilirsiniz ve AutoML verileri genişleterek herhangi bir sıranın gecikmelerinin tahmin ufku kadar geçerli olmasını sağlar.
Sonraki adımlar
- Zaman serisi tahmin modelini eğitmek için AutoML'yi ayarlama hakkında daha fazla bilgi edinin.
- AutoML Tahmin Sık Sorulan Sorular'a göz atın.
- AutoML'de zaman serisi tahmini için takvim özellikleri hakkında bilgi edinin.
- AutoML'nin tahmin modelleri oluşturmak için makine öğrenmesini nasıl kullandığı hakkında bilgi edinin.