ما هي خدمة Personalizer؟

مقالة
01/19/2024

هام

اعتبارا من 20 سبتمبر 2023، لن تتمكن من إنشاء موارد Personalizer جديدة. يتم إيقاف خدمة Personalizer في 1 أكتوبر 2026.

إشعار

اعتبارا من يوليو 2023، تشمل خدمات Azure الذكاء الاصطناعي جميع ما كان يعرف سابقا باسم Cognitive Services وAzure Applied الذكاء الاصطناعي Services. لا توجد تغييرات على الأسعار. يستمر استخدام الأسماء Cognitive Services وAzure Applied الذكاء الاصطناعي في فوترة Azure وتحليل التكلفة وقائمة الأسعار وواجهات برمجة التطبيقات للسعر. لا توجد تغييرات فاصلة على واجهات برمجة التطبيقات (APIs) أو SDKs.

Azure الذكاء الاصطناعي Personalizer هي خدمة الذكاء الاصطناعي تتخذ تطبيقاتك قرارات أكثر ذكاء على نطاق واسع باستخدام التعلم المعزز. يعالج Personalizer المعلومات حول حالة التطبيق و/ أو السيناريو و/ أو المستخدمين (السياقات)، ومجموعة من القرارات المحتملة والسمات ذات الصلة (الإجراءات) لتحديد أفضل قرار لاتخاذه. يتم إرسال التعليقات الواردة من تطبيقك (rewards) إلى Personalizer للتعرف على كيفية تحسين قدرتها على اتخاذ القرار في الوقت الفعلي تقريبًا.

يمكن لـ Personalizer تحديد أفضل الإجراءات التي يجب اتخاذها في مجموعة متنوعة من السيناريوهات:

التجارة الإلكترونية: ما المنتج الذي يجب عرضه للعملاء لزيادة احتمالية الشراء؟
توصية المحتوى: ما هي المقالة التي يجب عرضها لزيادة نسبة النقرات إلى الطلبات؟
تصميم المحتوى: أين يجب وضع الإعلان لتحسين تفاعل المستخدم على موقع الويب؟
الاتصال: متى وكيف يجب إرسال الإخطار لزيادة فرصة الاستجابة؟

لبدء استخدام Personalizer، اتبع دليل التشغيل السريع، أو جرب Personalizer في المستعرض باستخدام هذا العرض التوضيحي التفاعلي.

تحتوي هذه المستندات على أنواع المقالات التالية:

يوفرالتشغيل السريع إرشادات خطوة بخطوة لإرشادك خلال الإعداد ونموذج التعليمة البرمجية لبدء إرسال طلبات واجهة برمجة التطبيقات للخدمة.
تحتوي أدلة الكيفية على إرشادات لاستخدام ميزات برنامج التخصيص والقدرات المتقدمة.
توضح نماذج التعليمة البرمجية كيفية استخدام أداة التخصيص وتساعدك على ربط تطبيقك بالخدمة بسهولة.
تعد البرامج التعليمية خطوات إرشادية أطول لتطبيق Personalizer كجزء من حل أعمال أوسع.
توفر المفاهيم مزيدًا من التفاصيل حول ميزات برنامج التخصيص وإمكانياته وأساسياته.

كيف يعمل Personalizer؟

تستخدم أداة التخصيص التعلم المعزز لتحديد أفضل إجراءلسياق معين عبر جميع المستخدمين من أجل زيادة متوسط المكافأة.

السياق: المعلومات التي تصف حالة التطبيق أو السيناريو أو المستخدم الذي قد تكون ذات صلة باتخاذ القرار.
- مثال: الموقع ونوع الجهاز والعمر والموضوعات المفضلة للمستخدمين الذين يزورون موقع ويب.
الإجراءات: مجموعة منفصلة من العناصر التي يمكن اختيارها، جنبًا إلى جنب مع السمات التي تصف كل عنصر.
- مثال: مجموعة من المقالات الإخبارية والموضوعات التي تمت مناقشتها في كل مقالة.
المكافأة: درجة رقمية بين 0 و1 تشير إلى ما إذا كان القرار سيئا (0)، أو جيدا (1)
- مثال: يشير الرقم "1" إلى أن المستخدم نقر على المقالة المقترحة، بينما يشير الرقم "0" إلى أن المستخدم لم يفعل ذلك.

واجهات برمجة تطبيقات التصنيف والمكافأة

يمكنك Personalizer من الاستفادة من قوة ومرونة التعلم المعزز باستخدام اثنين فقط من واجهات برمجة التطبيقات الأساسية.

يتم استدعاء واجهة برمجة تطبيقات Rankبواسطة التطبيق الخاص بك في كل مرة يكون هناك قرار يجب اتخاذه. يرسل التطبيق JSON يحتوي على مجموعة من الإجراءات، والميزات التي تصف كل إجراء، والميزات التي تصف السياق الحالي. يُعرف كل استدعاء واجهة برمجة التطبيقات لنظام Rank بأنه حدث ويتم تسجيله بمعرف حدث فريد. يقوم Personalizer بعد ذلك بإرجاع معرف أفضل إجراء يزيد من إجمالي متوسط المكافأة كما هو محدد بواسطة النموذج الأساسي.

يتم استدعاء واجهة برمجة تطبيقات المكافأةبواسطة التطبيق الخاص بك كلما كانت هناك ملاحظات يمكن أن تساعد Personalizer على معرفة ما إذا كان معرف الإجراء الذي تم إرجاعه في قيمة استدعاء Rank المقدمة. على سبيل المثال، إذا نقر المستخدم على مقالة الأخبار المقترحة، أو أكمل شراء منتج مقترح. يمكن أن يكون استدعاء واجهة برمجة تطبيقات المكافأة في الوقت الفعلي (بعد إجراء استدعاء Rank) أو تأخيره ليناسب احتياجات السيناريو بشكل أفضل. يتم تحديد درجة المكافأة من خلال مقاييس وأهداف عملك ويمكن إنشاؤها بواسطة خوارزمية أو قواعد في تطبيقك. الدرجة هي رقم حقيقي بين 0 و1.

أوضاع التعلم

وضع المتدرب على غرار الطريقة التي يتعلم بها المتدرب حرفة من خلال مراقبة خبير، يمكّن وضع المتدرب Personalizer من التعلم من خلال مراقبة منطق القرار الحالي لتطبيقك. يساعد هذا في تخفيف ما يسمى بمشكلة "cold start" بنموذج جديد غير مدرب، ويسمح لك بالتحقق من صحة الإجراء وميزات السياق التي يتم إرسالها إلى Personalizer. في وضع المبتدئ، يقوم كل استدعاء إلى واجهة برمجة تطبيقات Rank بإرجاع الإجراء الأساسي أو الإجراء الافتراضي وهو الإجراء الذي كان التطبيق سيتخذه دون استخدام Personalizer. يتم إرسال هذا بواسطة تطبيقك إلى Personalizer في Rank API كأول عنصر في مجموعة الإجراءات الممكنة.
Online mode سيعرض أداة التخصيص أفضل إجراء، بالنظر إلى السياق، كما هو محدد بواسطة نموذج RL الأساسي ويستكشف الإجراءات المحتملة الأخرى التي قد تحسن الأداء. يتعلم Personalizer من الملاحظات المقدمة في الاستدعاء إلى Reward API.

لاحظ أن Personalizer يستخدم المعلومات الجماعية عبر جميع المستخدمين لمعرفة أفضل الإجراءات بناءً على السياق الحالي. لا تقوم الخدمة بما يلي:

تستمر وتدير معلومات الملف التعريفي للمستخدم. يجب عدم إرسال معرفات المستخدم الفريدة إلى Personalizer.
سجل تفضيلات المستخدمين الفردية أو البيانات التاريخية.

سيناريوهات مقدمة كمثال

فيما يلي بعض الأمثلة حيث يمكن استخدام برنامج Personalizer لتحديد أفضل محتوى لعرضه للمستخدم.

نوع المحتوى	الإجراءات {features}	الميزات الخاصة بالسياق	معرف إجراء مرتجع المكافأة (عرض هذا المحتوى)
مقالات إخبارية	أ. `The president...`، {وطني، سياسي، [نص]} ب. `Premier League ...`، {عالمي، رياضي، [نص، صورة، فيديو]} ج. `Hurricane in the ...`، {إقليمي، طقس، [نص، صورة]}	Country='USA', Recent_Topics=('politics', 'business'), Month='October'	أ `The president...`
الأفلام	1. `Star Wars` {1977, [action, adventure, fantasy], George Lucas} 2. `Hoop Dreams` {1994, [documentary, sports], Steve James} 3. `Casablanca` {1942, [romance, drama, war], Michael Curtiz}	Device='smart TV', Screen_Size='large', Favorite_Genre='classics'	3 `Casablanca`
منتجات التجارة الإلكترونية	i. `Product A` {3 kg, $$$$, deliver in 1 day} ثانياً. `Product B` {20 kg, $$, deliver in 7 days} ثالثاً. `Product C` {3 kg, $$$, deliver in 2 days}	Device='iPhone', Spending_Tier='low', Month='June'	ثانياً. `Product B`

متطلبات السيناريو

استخدم Personalizer عندما يكون السيناريو الخاص بك:

مجموعة محدودة من الإجراءات أو العناصر للاختيار من بينها في كل حدث تخصيص. نوصي بما لا يزيد عن 50 إجراءً في كل استدعاء Rank API. إذا كان لديك مجموعة أكبر من الإجراءات المحتملة، فإننا نقترح استخدام محرك توصية أو آلية أخرى لتقليل قائمة الإجراءات قبل استدعاء واجهة برمجة تطبيقات Rank.
معلومات تصف الإجراءات (ميزات الإجراء).
معلومات تصف السياق الحالي (الميزات السياقية).
حجم بيانات كافٍ لتمكين Personalizer من التعلم. بشكل عام، نوصي بحد أدنى يبلغ حوالي 1000 حدث في اليوم لتمكين Personalizer من التعلم بشكل فعال. إذا لم يتلق برنامج Personalizer بيانات كافية، فستستغرق الخدمة وقتًا أطول لتحديد أفضل الإجراءات.

الاستخدام المسؤول للذكاء الاصطناعي

في Microsoft، نحن ملتزمون بتطوير الذكاء الاصطناعي مدفوعًا بالمبادئ التي تضع الأشخاص في المقام الأول. الذكاء الاصطناعي النماذج مثل تلك المتوفرة في خدمة Personalizer لها فوائد محتملة كبيرة، ولكن بدون تصميم دقيق وتخفيف مدروس، فإن مثل هذه النماذج لديها القدرة على توليد محتوى غير صحيح أو حتى ضار. قامت Microsoft باستثمارات كبيرة للمساعدة في الحماية من إساءة الاستخدام والضرر غير المقصود، وتضمين مبادئ Microsoft لاستخدام الذكاء الاصطناعي المسؤول، وبناء عوامل تصفية المحتوى لدعم العملاء، وتوفير إرشادات تنفيذ الذكاء الاصطناعي المسؤولة للعملاء المدمجين. راجع مستندات الذكاء الاصطناعي المسؤولة ل Personalizer.

دمج Personalizer في تطبيق

تصميم وتخطيط الإجراءات والسياق. حدد كيفية تفسير التعليقات على أنها درجة مكافأة .

يتم تعريف كل مورد مخصص تقوم بإنشائه على أنه حلقة تعليمية واحدة. ستتلقى الحلقة كلا من استدعاءات Rank و Reward لهذا المحتوى أو تجربة المستخدم وتدريب نموذج RL أساسي. هناك

نوع المورد	الغرض
Apprentice mode - `E0`	قم بتدريب برنامج Personalizer لتقليد منطق اتخاذ القرار الحالي لديك دون التأثير على تطبيقك الحالي، قبل استخدام Online mode للتعرف على نهج أفضل في بيئة الإنتاج.
Online mode - Standard, `S0`	يستخدم Personalizer RL لتحديد أفضل الإجراءات في التشغيل.
Online mode - Free, `F0`	جرب Personalizer في بيئة محدودة غير تشغيلية.

أضف Personalizer إلى تطبيقك أو موقع الويب أو النظام:

أضف استدعاء Rank إلى Personalizer في التطبيق أو موقع الويب أو النظام لتحديد الإجراء الأفضل.
استخدم أفضل إجراء، كما هو محدد كمعرف إجراء مكافأة في السيناريو الخاص بك.

طبق منطق تسلسل العمل على سلوك المستخدم أو بيانات التعليقات لتحديد درجة المكافأة. على سبيل المثال:

السلوك	نقاط المكافأة المحسوبة
حدد المستخدم مقالة إخبارية اقترحها Personalizer	1
حدد المستخدم مقالة إخبارية ليست مقترحة بواسطة Personalizer	0
تردد المستخدم في تحديد مقال إخباري، وانتقل حوله بشكل غير حاسم، وفي النهاية اختار المقال الإخباري الذي اقترحه Personalizer	0.5

إضافة استدعاء مكافأة ترسل نقاط مكافأة بين 0 و1
- مباشرة بعد تلقي التعليقات.
- أو في وقت لاحق في السيناريوهات التي يتوقع فيها تأخر التعليقات الراجعة.
قم بتقييم الحلقة الخاصة بك من خلال تقييم دون اتصال بعد فترة من الوقت عندما يتلقى Personalizer بيانات مهمة لاتخاذ قرارات عبر الإنترنت. يسمح لك التقييم غير المتصل باختبار وتقييم فعالية خدمة Personalizer Service دون تغيير التعليمة البرمجية أو تأثير المستخدم.

الخطوات التالية

التشغيل السريع لـ Personalizer

مشاركة عبر