Bagikan melalui


Kebijakan dan pengaturan pembelajaran

Penting

Mulai tanggal 20 September 2023 Anda tidak akan dapat membuat sumber daya Personalizer baru. Layanan Personalizer dihentikan pada tanggal 1 Oktober 2026.

Pengaturan pembelajaran menentukan hyperparameters pelatihan model. Dua model dari data yang sama yang dilatih pada pengaturan pembelajaran yang berbeda akan berakhir berbeda.

Kebijakan dan pengaturan pembelajaran ditetapkan pada sumber daya Personalizer Anda di portal Azure.

Kebijakan pembelajaran impor dan ekspor

Anda dapat mengimpor dan mengekspor file kebijakan pembelajaran dari portal Azure. Gunakan metode ini untuk menyimpan kebijakan yang ada, mengujinya, menggantinya, dan mengarsipkannya di kontrol kode sumber Anda sebagai artefak untuk referensi dan audit di masa mendatang.

Pelajari cara mengimpor dan mengekspor kebijakan pembelajaran di portal Azure untuk sumber daya Personalizer Anda.

Memahami pengaturan kebijakan pembelajaran

Pengaturan dalam kebijakan pembelajaran tidak ditujukan untuk diubah. Ubah pengaturan hanya jika Anda memahami pengaruhnya terhadap Personalizer. Tanpa pengetahuan ini, Anda dapat menyebabkan masalah, termasuk membatalkan model Personalizer.

Personalizer menggunakan vowpalwabbit untuk melatih dan menilai peristiwa. Lihat dokumentasi vowpalwabbit tentang cara mengedit pengaturan pembelajaran menggunakan vocalpalwabbit. Setelah memiliki argumen baris perintah yang benar, simpan perintah ke file dengan format berikut (ganti nilai properti argumen dengan perintah yang diinginkan) dan unggah file untuk mengimpor pengaturan pembelajaran di panel pengaturan Model dan Pembelajaran di portal Azure untuk sumber daya Personalizer Anda.

.json berikut adalah contoh kebijakan pembelajaran.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Membandingkan kebijakan pembelajaran

Anda dapat membandingkan performa kebijakan pembelajaran yang berbeda terhadap data sebelumnya di log Personalizer dengan melakukan evaluasi offline.

Unggah kebijakan pembelajaran Anda sendiri untuk membandingkannya dengan kebijakan pembelajaran saat ini.

Mengoptimalkan kebijakan pembelajaran

Personalizer dapat membuat kebijakan pembelajaran yang dioptimalkan dalam evaluasi offline. Kebijakan pembelajaran yang dioptimalkan yang memiliki penghargaan lebih baik dalam evaluasi offline akan menghasilkan hasil yang lebih baik ketika digunakan secara online di Personalizer.

Setelah mengoptimalkan kebijakan pembelajaran, Anda dapat menerapkannya langsung ke Personalizer sehingga dapat segera menggantikan kebijakan saat ini. Atau Anda dapat menyimpan kebijakan yang dioptimalkan untuk evaluasi selengkapnya dan kemudian memutuskan apakah akan membuang, menyimpan, atau menerapkannya.

Langkah berikutnya