Apa itu Personalizer?

Artikel
01/19/2024

Penting

Mulai tanggal 20 September 2023 Anda tidak akan dapat membuat sumber daya Personalizer baru. Layanan Personalizer dihentikan pada tanggal 1 Oktober 2026.

Catatan

Pada Juli 2023, layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Cognitive Services dan Azure Applied AI Services. Tidak ada perubahan pada harga. Nama Cognitive Services dan Azure Applied AI terus digunakan dalam tagihan Azure, analisis biaya, daftar harga, dan API harga. Tidak ada perubahan yang melanggar pada antarmuka pemrograman aplikasi (API) atau SDK.

Azure AI Personalizer adalah layanan AI yang membuat keputusan yang lebih cerdas dalam skala besar menggunakan pembelajaran penguatan. Personalizer memproses informasi tentang status aplikasi, skenario, dan/atau pengguna Anda (konteks), dan serangkaian kemungkinan keputusan dan atribut terkait (tindakan) untuk menentukan keputusan terbaik yang akan dibuat. Umpan balik dari aplikasi Anda (hadiah) dikirim ke Personalizer untuk mempelajari cara meningkatkan kemampuan pengambilan keputusannya dalam waktu dekat secara real time.

Personalizer dapat menentukan tindakan terbaik yang dapat diambil dalam berbagai skenario:

E-niaga: Produk apa yang harus ditunjukkan kepada pelanggan untuk memaksimalkan kemungkinan pembelian?
Rekomendasi konten: Artikel apa yang harus ditampilkan untuk meningkatkan kecepatan klik-tayang?
Desain konten: Di mana iklan harus ditempatkan untuk mengoptimalkan keterlibatan pengguna di situs web?
Komunikasi: Kapan dan bagaimana pemberitahuan harus dikirim untuk memaksimalkan peluang respons?

Untuk mulai menggunakan Personalizer, ikuti panduan mulai cepat, atau coba Personalizer di browser Anda dengan demo interaktif ini.

Dokumentasi ini berisi jenis artikel berikut ini:

Mulai cepat menyediakan instruksi langkah demi langkah untuk memandu Anda melalui penyiapan dan kode sampel untuk mulai membuat permintaan API ke layanan.
Panduan cara penggunaan berisi instruksi untuk menggunakan fitur Personalizer dan kemampuan tingkat lanjut.
Sampel kode menunjukkan cara menggunakan Personalizer dan membantu Anda dengan mudah menghubungkan aplikasi Anda dengan layanan.
Tutorial adalah panduan lebih panjang yang menerapkan Personalizer sebagai bagian dari solusi bisnis yang lebih luas.
Konsep memberikan detail lebih lanjut tentang fitur, kemampuan, dan dasar-dasar Personalizer.

Bagaimana cara kerja Personalizer?

Personalizer menggunakan pembelajaran penguatan untuk memilih tindakan terbaik pada konteks tertentu di semua pengguna untuk memaksimalkan hadiah rata-rata.

Konteks: Informasi yang menjelaskan status aplikasi, skenario, atau pengguna Anda yang mungkin relevan untuk membuat keputusan.
- Contoh: Lokasi, jenis perangkat, usia, dan topik favorit pengguna yang mengunjungi situs web.
Tindakan: Sekumpulan item diskrit yang dapat dipilih, bersama dengan atribut yang menjelaskan setiap item.
- Contoh: Sekumpulan artikel berita dan topik yang dibahas di setiap artikel.
Hadiah: Skor numerik antara 0 dan 1 yang menunjukkan apakah keputusan buruk (0), atau baik (1)
- Contoh: "1" menunjukkan bahwa pengguna mengeklik artikel yang disarankan, sedangkan "0" menunjukkan pengguna tidak melakukannya.

API Peringkat dan Hadiah

Personalizer memberdayakan Anda untuk memanfaatkan kekuatan dan fleksibilitas pembelajaran penguatan dengan menggunakan hanya dua API utama.

RANKAPI dipanggil oleh aplikasi Anda setiap kali ada keputusan yang akan dibuat. Aplikasi mengirimkan JSON yang berisi serangkaian tindakan, fitur yang menjelaskan setiap tindakan, dan fitur yang menjelaskan konteks saat ini. Setiap panggilan Rank API dikenal sebagai peristiwa dan dicatat dengan ID peristiwa yang unik. Personalizer kemudian mengembalikan ID tindakan terbaik yang memaksimalkan total hadiah rata-rata sebagaimana ditentukan oleh model yang mendasar.

REWARDAPI dipanggil oleh aplikasi Anda setiap kali ada umpan balik yang dapat membantu Personalizer mempelajari apakah ID tindakan yang dikembalikan dalam nilai panggilan Peringkat yang disediakan. Misalnya, jika pengguna mengeklik artikel berita yang disarankan, atau menyelesaikan pembelian produk yang disarankan. Panggilan ke REWARD API dapat dilakukan secara real time (tepat setelah panggilan Peringkat dilakukan) atau tertunda agar lebih sesuai dengan kebutuhan skenario. Skor hadiah ditentukan oleh metrik dan tujuan bisnis Anda dan dapat dihasilkan oleh algoritma atau aturan dalam aplikasi Anda. Skor adalah angka bernilai nyata antara 0 dan 1.

Mode pembelajaran

Mode magang Serupa dengan bagaimana seorang magang mempelajari kerajinan dari mengamati seorang ahli, mode Magang memungkinkan Personalizer untuk belajar dengan mengamati logika keputusan aplikasi Anda saat ini. Ini membantu mengurangi apa yang disebut masalah "cold start" dengan model baru yang tidak terlatih, dan memungkinkan Anda untuk memvalidasi fitur tindakan dan konteks yang dikirim ke Personalizer. Dalam mode Magang, setiap panggilan ke RANK API mengembalikan tindakan dasar atau tindakan default yang merupakan tindakan yang akan diambil aplikasi tanpa menggunakan Personalizer. Ini dikirim oleh aplikasi Anda ke Personalizer di Rank API sebagai item pertama dalam kumpulan tindakan yang dapat diambil.
Mode online Personalizer akan mengembalikan tindakan terbaik, mengingat konteksnya, sebagaimana ditentukan oleh model RL yang mendasar dan mengeksplorasi kemungkinan tindakan lain yang dapat meningkatkan performa. Personalizer belajar dari umpan balik yang diberikan dalam panggilan ke Reward API.

Perhatikan bahwa Personalizer menggunakan informasi kolektif di semua pengguna untuk mempelajari tindakan terbaik berdasarkan konteks saat ini. Layanan ini tidak:

Mempertahankan dan mengelola informasi profil pengguna. ID pengguna unik tidak boleh dikirim ke Personalizer.
Mencatat preferensi pengguna individu atau data historis.

Skenario contoh

Berikut adalah beberapa contoh ketika Personalizer dapat digunakan untuk memilih konten terbaik yang akan dirender untuk pengguna.

Jenis konten	Tindakan {fitur}	Fitur konteks	ID Tindakan Hadiah yang Dikembalikan (tampilkan isi ini)
Artikel berita	a. `The president...`, {nasional, politik, [teks]} b. `Premier League ...` {global, olahraga, [teks, gambar, video]} c. `Hurricane in the ...` {regional, cuaca, [teks, gambar]}	Negara='AS', Topik_Terbaru=('politik', 'bisnis'), Bulan='Oktober'	a `The president...`
Film	1. `Star Wars` {1977, [aksi, petualangan, fantasi], George Lucas} 2. `Hoop Dreams` {1994, [dokumenter, olahraga], Steve James} 3. `Casablanca` {1942, [percintaan, drama, perang], Michael Curtiz}	Perangkat='smart TV', Ukuran_Layar='besar', Genre_Favorit='klasik'	3. `Casablanca`
Produk E-niaga	i. `Product A`{3 kg, $$$$, pengiriman dalam 1 hari} ii. `Product B` {20 kg, $$, pengiriman dalam 7 hari} iii. `Product C` {3 kg, $$$, pengiriman dalam 2 hari}	Perangkat='iPhone', Tingkat_Pengeluaran='rendah', Bulan='Juni'	ii. `Product B`

Persyaratan skenario

Gunakan Personalizer jika skenario Anda memiliki:

Serangkaian tindakan atau item terbatas yang dapat dipilih di setiap acara personalisasi. Kami merekomendasikan tidak lebih dari ~ 50 tindakan di setiap panggilan Rank API. Jika Anda memiliki serangkaian tindakan yang lebih besar, sebaiknya gunakan mesin rekomendasi atau mekanisme lain untuk mengurangi daftar tindakan sebelum memanggil RANK API.
Informasi yang menjelaskan tindakan (fitur tindakan).
Informasi yang menggambarkan konteks saat ini (fitur kontekstual).
Volume data yang memadai sehingga Personalizer dapat belajar. Secara umum, kami merekomendasikan minimal ~ 1.000 peristiwa per hari untuk memungkinkan Personalizer belajar secara efektif. Jika Personalizer tidak menerima data yang memadai, layanan membutuhkan waktu lebih lama untuk menentukan tindakan terbaik.

Penggunaan AI yang bertanggung jawab

Di Microsoft, kami berkomitmen untuk kemajuan AI yang didorong oleh prinsip-prinsip yang mengutamakan manusia. Model AI seperti yang tersedia dalam layanan Personalizer memiliki manfaat potensial yang signifikan, tetapi tanpa desain yang cermat dan mitigasi yang bijaksana, model tersebut berpotensi menghasilkan konten yang salah atau bahkan berbahaya. Microsoft telah melakukan investasi yang signifikan untuk membantu melindungi dari penyalahgunaan dan bahaya yang tidak diinginkan, menggabungkan prinsip-prinsip Microsoft untuk penggunaan AI yang bertanggung jawab, membangun filter konten untuk mendukung pelanggan, dan memberikan panduan implementasi AI yang bertanggung jawab kepada pelanggan onboarding. Lihat dokumen AI yang bertanggung jawab untuk Personalizer.

Mengintegrasikan Personalizer ke dalam aplikasi

Rancang dan rencanakan tindakan, dan konteks. Tentukan cara menafsirkan umpan balik sebagai skor hadiah.

Setiap Sumber Daya Personalizer yang Anda buat dianggap sebagai salah satu Perulangan Pembelajaran. Perulangan akan menerima panggilan Peringkat dan Hadiah untuk konten atau pengalaman pengguna tersebut dan melatih model RL yang mendasar. Tersedia

Jenis Sumber Daya	Kegunaan
Mode magang - `E0`	Latih Personalizer untuk menilik logika pengambilan keputusan Anda saat ini tanpa memengaruhi aplikasi yang ada, sebelum menggunakan mode Online untuk mempelajari kebijakan yang lebih baik di lingkungan produksi.
Mode online - Standar, `S0`	Personalizer menggunakan RL untuk menentukan tindakan terbaik dalam produksi.
Mode online - Gratis, `F0`	Coba Personalizer di lingkungan non-produksi terbatas.

Tambahkan Personalizer ke aplikasi, situs web, atau sistem Anda:

Tambahkan panggilan Rank ke Personalizer di aplikasi, situs web, atau sistem Anda untuk menentukan tindakan terbaik.
Gunakan tindakan terbaik, sebagaimana ditentukan sebagai ID tindakan hadiah dalam skenario Anda.

Terapkan logika bisnis ke perilaku pengguna atau data umpan balik untuk menentukan skor hadiah. Contohnya:

Perilaku	Skor hadiah terhitung
Pengguna memilih artikel berita yang disarankan oleh Personalizer	1
Pengguna memilih artikel berita yang tidak disarankan oleh Personalizer	0
Pengguna ragu untuk memilih artikel berita, melihat-lihat dengan bimbang, dan akhirnya memilih artikel berita yang disarankan oleh Personalizer	0.5

Tambahkan panggilan Hadiah yang mengirimkan skor hadiah antara 0 dan 1
- Segera setelah umpan balik diterima.
- Atau beberapa saat kemudian dalam skenario ketika umpan balik yang tertunda diharapkan.
Evaluasi perulangan Anda dengan evaluasi offline setelah jangka waktu tertentu ketika Personalizer telah menerima data yang signifikan untuk membuat keputusan online. Dengan evaluasi offline, Anda dapat menguji dan menilai efektivitas Layanan Personalizer tanpa perubahan kode atau dampak bagi pengguna.

Langkah berikutnya

Mulai cepat Personalizer