ما هو الكشف عن معلومات التعريف الشخصية (PII) بلغة Azure الذكاء الاصطناعي؟

يعد الكشف عن PII إحدى الميزات التي تقدمها Azure الذكاء الاصطناعي Language، وهي مجموعة من التعلم الآلي وخوارزميات الذكاء الاصطناعي في السحابة لتطوير التطبيقات الذكية التي تتضمن لغة مكتوبة. يمكن لميزة الكشف عن PII تحديد وتصنيف وتنقيح المعلومات الحساسة في نص غير منظم. على سبيل المثال: أرقام الهواتف وعناوين البريد الإلكتروني وأشكال التعريف. تختلف طريقة استخدام PII في المحادثات عن حالات الاستخدام الأخرى، وتكون مقالات هذا الاستخدام منفصلة.

يأتي PII في شكلين:

سير العمل التقليدي

لاستخدام هذه الميزة، تقوم بإرسال البيانات للتحليل والتعامل مع إخراج واجهة برمجة التطبيقات في التطبيق الخاص بك. يتم إجراء التحليل كما هو، مع عدم وجود تخصيص إضافي للنموذج المستخدم على بياناتك.

  1. إنشاء مورد Azure الذكاء الاصطناعي Language، والذي يمنحك حق الوصول إلى الميزات التي تقدمها Azure الذكاء الاصطناعي Language. يقوم بإنشاء كلمة مرور (تسمى مفتاح) وعنوان URL لنقطة النهاية التي تستخدمها لمصادقة طلبات واجهة برمجة التطبيقات.

  2. قم بإنشاء طلب باستخدام إما واجهة برمجة تطبيقات REST أو مكتبة العميل لـ C# وJava وJavaScript وPython. يمكنك أيضاً إرسال استدعاءات غير متزامنة مع طلب دفعة لدمج طلبات واجهة برمجة التطبيقات لميزات متعددة في مكالمة واحدة.

  3. أرسل الطلب الذي يحتوي على البيانات النصية. يتم استخدام المفتاح ونقطة النهاية للمصادقة.

  4. قم بنقل الاستجابة أو تخزينها محليًا.

دعم المستند الأصلي

يشير المستند الأصلي إلى تنسيق الملف المستخدم لإنشاء المستند الأصلي مثل Microsoft Word (docx) أو ملف مستند محمول (pdf). يلغي دعم المستند الأصلي الحاجة إلى المعالجة المسبقة للنص قبل استخدام قدرات مورد Azure الذكاء الاصطناعي Language. حاليا، يتوفر دعم المستند الأصلي لإمكانية PiiEntityRecognition .

يدعم PII حاليا تنسيقات المستندات الأصلية التالية:

نوع الملف امتداد الملف ‏‏الوصف
نص .txt مستند نصي غير منسق.
Adobe PDF .pdf مستند محمول بتنسيق ملف مستند.
Microsoft Word .docx ملف مستند Microsoft Word.

لمزيد من المعلومات، راجعاستخدام المستندات الأصلية لمعالجة اللغة

بدء استخدام الكشف عن PII

لاستخدام الكشف عن PII، يمكنك إرسال نص للتحليل ومعالجة إخراج واجهة برمجة التطبيقات في التطبيق الخاص بك. يتم إجراء التحليل كما هو، دون أي تخصيص للنموذج المستخدم على بياناتك. هناك طريقتان لاستخدام الكشف عن PII:

خيار التطوير ‏‏الوصف
استوديو اللغة Language Studio هو نظام أساسي مستند إلى الويب يتيح لك محاولة ربط الكيان بأمثلة نصية بدون حساب Azure، وبياناتك الخاصة عند التسجيل. لمزيد من المعلومات، راجع موقع ويب Language Studio أو التشغيل السريع لاستوديو اللغة.
واجهة برمجة تطبيقات REST أو مكتبة العميل (Azure SDK) دمج الكشف عن PII في تطبيقاتك باستخدام واجهة برمجة تطبيقات REST، أو مكتبة العميل المتوفرة بلغات مختلفة. لمزيد من المعلومات، راجع التشغيل السريع للكشف عن PII.

الوثائق المرجعية وعينات التعليمات البرمجية

أثناء استخدام هذه الميزة في التطبيقات الخاصة بك، راجع الوثائق المرجعية والعينات التالية ل Azure الذكاء الاصطناعي Language:

خيار التطوير / اللغة الوثائق المرجعية العينات
واجهة برمجة تطبيقات REST وثائق REST API
C#‎ وثائق C#‎ عينات C#‎
Java وثائق Java نماذج Java
JavaScript وثائق JavaScript نماذج JavaScript
Python وثائق Python عينات Python

الذكاء الاصطناعي المسؤول

لا يتضمن نظام الذكاء الاصطناعي التقنية فحسب، بل يشمل أيضا الأشخاص الذين يستخدمونها، والأشخاص المتأثرين بها، وبيئة النشر. اقرأ ملاحظة الشفافية حول PII لمعرفة المزيد حول استخدام الذكاء الاصطناعي المسؤول وعملية التوزيع في أنظمتك. لمزيد من المعلومات، راجع المقالات التالية:

سيناريوهات مقدمة كمثال

  • تطبيق تسميات الحساسية - على سبيل المثال، استنادا إلى النتائج من خدمة PII، قد يتم تطبيق وصف الحساسية العامة على المستندات التي لا يتم فيها الكشف عن كيانات PII. بالنسبة للمستندات التي يتم فيها التعرف على عناوين الولايات المتحدة وأرقام الهواتف، قد يتم تطبيق تسمية سرية. يمكن استخدام تسمية سرية للغاية للمستندات التي يتم فيها التعرف على أرقام التوجيه المصرفي.
  • تنقيح بعض فئات المعلومات الشخصية من المستندات التي يتم تداولها بشكل أوسع - على سبيل المثال، إذا كان يمكن لممثلي الدعم في الخطوط الأمامية الوصول إلى سجلات جهات الاتصال الخاصة بالعميل، فيمكن للشركة تنقيح المعلومات الشخصية للعميل بالإضافة إلى اسمه من إصدار سجل العميل للحفاظ على خصوصية العميل.
  • تنقيح المعلومات الشخصية من أجل الحد من التحيز اللاواعي - على سبيل المثال، أثناء عملية مراجعة السيرة الذاتية للشركة، يمكنهم حظر الاسم والعنوان ورقم الهاتف للمساعدة في تقليل التحيزات غير الوعيية أو التحيزات الأخرى.
  • استبدل المعلومات الشخصية في بيانات المصدر للتعلم الآلي لتقليل الظلم - على سبيل المثال، إذا كنت تريد إزالة الأسماء التي قد تكشف عن نوع الجنس عند تدريب نموذج التعلم الآلي، فيمكنك استخدام الخدمة لتحديدها ويمكنك استبدالها بعناصر نائبة عامة لتدريب النموذج.
  • إزالة المعلومات الشخصية من كتابة مركز الاتصال - على سبيل المثال، إذا كنت تريد إزالة الأسماء أو بيانات PII الأخرى التي تحدث بين العامل والعميل في سيناريو مركز الاتصال. يمكنك استخدام الخدمة لتحديدها وإزالتها.
  • تنظيف البيانات لعلوم البيانات - يمكن استخدام PII لجعل البيانات جاهزة لعلماء البيانات والمهندسين لكي يتمكنوا من استخدام هذه البيانات لتدريب نماذج التعلم الآلي الخاصة بهم. تنقيح البيانات للتأكد من عدم كشف بيانات العميل.

الخطوات التالية

هناك طريقتان لبدء استخدام ميزة ربط الكيان:

  • لغة الاستوديو، وهو نظام أساسي قائم على الويب يمكنك من تجربة العديد من ميزات خدمة لغة Azure دون الحاجة إلى كتابة التعليمات البرمجية.
  • مقالة البدء السريع للحصول على إرشادات حول إجراء طلبات إلى الخدمة باستخدام API REST SDK ومكتبة العميل.