Fitur lag untuk prakiraan rangkaian waktu di AutoML
Artikel ini menjelaskan bagaimana pembelajaran mesin otomatis (AutoML) di Azure Pembelajaran Mesin membuat fitur agregasi jendela jeda dan bergulir untuk membantu Anda memperkirakan model regresi rangkaian waktu. Fitur AutoML menggunakan data model historis yang dapat secara signifikan meningkatkan akurasi model dengan membantu model mempelajari pola korelasi tepat waktu.
Jika Anda tertarik untuk mempelajari selengkapnya tentang metodologi prakiraan di AutoML, lihat Gambaran umum metode prakiraan di AutoML. Untuk menjelajahi contoh pelatihan untuk model prakiraan di AutoML, lihat Menyiapkan AutoML untuk melatih model prakiraan rangkaian waktu dengan SDK dan CLI.
Fiturisasi lag di AutoML
AutoML menghasilkan fitur lag yang sesuai dengan cakrawala prakiraan. Bagian ini mengeksplorasi fiturisasi jeda di AutoML untuk model dengan cakrawala prakiraan tiga dan urutan jeda target satu. Tabel berikut menyajikan data model dan fitur jeda untuk rangkaian waktu bulanan.
Tabel 1: Rangkaian waktu asli
Tanggal | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
Langkah pertama menghasilkan fitur jeda untuk horizon $h=1$ saja. Tabel berikutnya menunjukkan mengapa proses menggunakan cakrawala individu untuk menyelesaikan fiturisasi jeda.
Tabel 2: Fiturisasi lag untuk horizon $h=1$
Tanggal | $y_t$ | Asal | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
AutoML menghasilkan data dalam Tabel 2 dari data di Tabel 1 dengan menggeser kolom $y_t$ ke bawah dengan satu pengamatan. Tabel 2 hingga 5 menyertakan kolom Asal untuk memperlihatkan tanggal asal fitur jeda.
Langkah selanjutnya menghasilkan fitur jeda untuk cakrawala prakiraan $h=2$ saja.
Tabel 3: Fiturisasi lag untuk horizon prakiraan $h=2$
Tanggal | $y_t$ | Asal | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
AutoML menghasilkan data dalam Tabel 3 dari data di Tabel 1 dengan menggeser kolom $y_t$ ke bawah dengan dua pengamatan.
Langkah selanjutnya menghasilkan fitur jeda untuk horizon prakiraan $h=3$ saja.
Tabel 4: Fiturisasi lag untuk horizon prakiraan $h=3$
Tanggal | $y_t$ | Asal | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Langkah terakhir menggabungkan data dalam Tabel 1, 2, dan 3, dan menyusun ulang baris.
Tabel 5: Fiturisasi lag selesai
Tanggal | $y_t$ | Asal | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Dalam Tabel 5, kolom jeda diganti namanya menjadi $y_{t-1}^{(h)}$ untuk mencerminkan bahwa jeda dihasilkan sehubungan dengan cakrawala tertentu. Tabel 5 menunjukkan bagaimana jeda yang dihasilkan sehubungan dengan cakrawala dapat dipetakan ke cara konvensional menghasilkan jeda di tabel sebelumnya.
Tabel 5 adalah contoh augmentasi data yang diterapkan AutoML ke data pelatihan untuk mengaktifkan prakiraan langsung dari model regresi. Ketika konfigurasi mencakup fitur lag, AutoML membuat lag yang bergantung pada horizon bersama dengan fitur horizon bernilai bilangan bulat. Model regresi prakiraan AutoML dapat membuat prediksi di horizon $h$ tanpa memperhatikan prediksi pada $h-1 $, berbeda dengan model yang ditentukan secara rekursif seperti ARIMA.
Pertimbangan untuk fiturisasi jeda
Ada beberapa pertimbangan yang terkait dengan fiturisasi jeda untuk model. Tinjau bagian berikut untuk mengidentifikasi potensi tindakan untuk skenario Anda.
Pertumbuhan ukuran himpunan data
Ketika AutoML menghasilkan fitur lag yang bergantung pada horizon, AutoML menambahkan baris baru ke himpunan data model. Jumlah baris baru sebanding dengan cakrawala prakiraan.
Pertumbuhan dalam ukuran himpunan data dapat menyebabkan kesalahan di luar memori pada simpul komputasi yang lebih kecil atau ketika ukuran himpunan data sudah besar. Anda dapat menemukan solusi untuk mengatasi masalah ini di Tanya Jawab Umum (FAQ) untuk prakiraan AutoML.
Pemisahan urutan jeda dan cakrawala prakiraan
Strategi tertinggal AutoML memisahkan urutan jeda dan cakrawala prakiraan. Misalkan cakrawala prakiraan Anda adalah tujuh, dan Anda ingin AutoML menggunakan fitur jeda. Dalam skenario ini, Anda tidak perlu mengatur urutan jeda ke tujuh untuk memastikan prediksi melalui cakrawala prakiraan penuh. Karena AutoML menghasilkan jeda sehubungan dengan cakrawala, Anda dapat mengatur urutan jeda menjadi satu. AutoML menambah data sehingga jeda urutan apa pun valid hingga cakrawala prakiraan.