Kebijakan dan pengaturan pembelajaran

Penting

Mulai 20 September 2023 Anda tidak akan dapat membuat sumber daya Personalizer baru. Layanan Personalizer dihentikan 1 Oktober 2026. Sebaiknya migrasikan ke microsoft/learning-loop sumber terbuka.

Pengaturan pembelajaran menentukan hiperparameter pelatihan model. Dua model dari data yang sama yang dilatih pada pengaturan pembelajaran yang berbeda akan berakhir berbeda.

Pengaturan dan pengaturanLearning diatur pada sumber daya Personalizer Anda di portal Azure.

Kebijakan pembelajaran impor dan ekspor

Anda dapat mengimpor dan mengekspor file kebijakan pembelajaran dari portal Azure. Gunakan metode ini untuk menyimpan kebijakan yang ada, mengujinya, menggantinya, dan mengarsipkannya di kontrol kode sumber Anda sebagai artefak untuk referensi dan audit di masa mendatang.

Pelajari bagaimana cara mengimpor dan mengekspor kebijakan pembelajaran di portal Azure untuk sumber daya Personalizer Anda.

Memahami pengaturan kebijakan pembelajaran

Pengaturan dalam kebijakan pembelajaran tidak ditujukan untuk diubah. Ubah pengaturan hanya jika Anda memahami pengaruhnya terhadap Personalizer. Tanpa pengetahuan ini, Anda dapat menyebabkan masalah, termasuk membatalkan model Personalizer.

Personalizer menggunakan vowpalwabbit untuk melatih dan menilai peristiwa. Lihat dokumentasi vowpalwabbit tentang cara mengedit pengaturan pembelajaran menggunakan vocalpalwabbit. Setelah Anda memiliki argumen baris perintah yang benar, simpan perintah ke file dengan format berikut (ganti nilai properti argumen dengan perintah yang diinginkan) dan unggah file untuk mengimpor pengaturan pembelajaran di panel Model dan Pengaturan Pembelajaran di portal Azure untuk sumber daya Personalizer Anda.

.json berikut adalah contoh kebijakan pembelajaran.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Membandingkan kebijakan pembelajaran

Anda dapat membandingkan performa kebijakan pembelajaran yang berbeda terhadap data sebelumnya di log Personalizer dengan melakukan evaluasi offline.

Unggah kebijakan pembelajaran Anda sendiri untuk membandingkannya dengan kebijakan pembelajaran saat ini.

Mengoptimalkan kebijakan pembelajaran

Personalizer dapat membuat kebijakan pembelajaran yang dioptimalkan dalam evaluasi offline. Kebijakan pembelajaran yang dioptimalkan yang memiliki penghargaan lebih baik dalam evaluasi offline akan menghasilkan hasil yang lebih baik ketika digunakan secara online di Personalizer.

Setelah mengoptimalkan kebijakan pembelajaran, Anda dapat menerapkannya langsung ke Personalizer sehingga dapat segera menggantikan kebijakan saat ini. Atau Anda dapat menyimpan kebijakan yang dioptimalkan untuk evaluasi selengkapnya dan kemudian memutuskan apakah akan membuang, menyimpan, atau menerapkannya.

Langkah berikutnya

Pelajari peristiwa aktif dan tidak aktif.

Last updated on 2026-04-09