البدء في تحليل النص

مكتمل

تعد Azure الذكاء الاصطناعي Language جزءا من عروض خدمات Azure الذكاء الاصطناعي التي يمكنها إجراء معالجة متقدمة للغة الطبيعية عبر نص غير منظم. تتضمن ميزات تحليل نص Azure الذكاء الاصطناعي Language ما يلي:

  • يعرف التعرف على الكيان المسمى الأشخاص والأماكن والأحداث والمزيد. يمكن أيضا تخصيص هذه الميزة لاستخراج فئات مخصصة.
  • يحدد ربط الكيان الكيانات المعروفة جنبا إلى جنب مع ارتباط إلى ويكيبيديا.
  • يحدد الكشف عن معلومات التعريف الشخصية (PII) المعلومات الحساسة شخصيا، بما في ذلك معلومات الصحة الشخصية (PHI).
  • يحدد الكشف عن اللغة لغة النص ويعيد رمز لغة مثل "en" للغة الإنجليزية.
  • يحدد تحليل المشاعر والتنقيب عن الآراء ما إذا كان النص إيجابيا أم سلبيا.
  • يلخص التلخيص النص من خلال تحديد أهم المعلومات.
  • يسرد استخراج العبارة الرئيسية المفاهيم الرئيسية من النص غير المهيكل.

التعرف على الكيان وربطه

يمكنك تزويد Azure الذكاء الاصطناعي Language مع نص غير منظم وسيعيد قائمة بالكيانات في النص الذي يتعرف عليه. الكيان هو عنصر من نوع معين أو فئة معينة؛ وفي بعض الحالات، النوع الفرعي، مثل تلك كما هو موضح في الجدول التالي.

النوع النوع الفرعي مثال
الشخص "بيل غيتس"، "جون"
الموقع "باريس"، "نيويورك"
المنظمة "Microsoft"
الكمية الرقم "6" أو "ستة"
الكمية النسبة المئوية "25%" أو "خمسون بالمائة"
الكمية ترتيبي "1" أو "الأول"
الكمية العمر "90 يومًا" أو "30 سنة"
الكمية عملة "10.99"
الكمية البُعد "10 أميال"، "40 سم"
الكمية درجة الحرارة "45 درجة"
DateTime "6:30 مساء، 4 فبراير، 2012"
DateTime التاريخ‬ "2 مايو 2017" أو "02/05/2017"
DateTime الوقت "8 ص" أو "8:00"
DateTime المدى الزمني "من 2 مايو إلى 5 مايو"
DateTime المدى الزمني "6 م إلى 7 م"
DateTime المدة "1 دقيقة و45 ثانية"
DateTime المجموعة "كل ثلاثاء"
عنوان URL "https://www.bing.com"
بريد إلكتروني "support@microsoft.com"
رقم هاتف بالولايات المتحدة "(312) 555-0176"
عنوان IP "10.0.1.125"

تدعم Azure الذكاء الاصطناعي Language أيضا ربط الكيان للمساعدة في إزالة الغموض عن الكيانات عن طريق الارتباط بمرجع معين. بالنسبة للكيانات المعترف بها، تقوم الخدمة بإرجاع عنوان URL لمقالة ويكيبيديا ذات الصلة.

على سبيل المثال، افترض أنك تستخدم Azure الذكاء الاصطناعي Language للكشف عن الكيانات في استخراج مراجعة المطعم التالي:

"أكلتُ في المطعم في "سياتل" الأسبوع الماضي."

الكيان النوع النوع الفرعي عنوان URL لويكيبيديا
سياتل الموقع https://en.wikipedia.org/wiki/Seattle
‏‏الأسبوع الماضي DateTime المدى الزمني

اكتشاف اللغات

استخدم إمكانية الكشف عن اللغة في Azure الذكاء الاصطناعي Language لتحديد اللغة التي تتم كتابة النص بها. يمكنك إرسال عدة مستندات في نفس الوقت للتحليل. لكل مستند تم إرساله، ستكتشف الخدمة ما يلي:

  • اسم اللغة (على سبيل المثال "الإنجليزية").
  • رمز اللغة ISO 639-1 (على سبيل المثال، "en").
  • درجة تشير إلى مستوى الثقة في اكتشاف اللغة.

على سبيل المثال، ضع في اعتبارك سيناريو تملك فيه مطعمًا وتشغله ويمكن للعملاء فيه إكمال الاستطلاعات وتقديم ملاحظات حول الطعام والخدمة والموظفين وما إلى ذلك. افترض أنك تلقيت التقييمات التالية من العملاء:

تقييم 1: "مكان رائع لتناول طعام الغداء. لقد كان الحساء لذيذًا."

تقييم 2: "Comida maravillosa y gran servicio."

تقييم 3: "The croque monsieur avec frites was terrific. Bon appetit!"

يمكنك استخدام قدرات تحليلات النص في Azure الذكاء الاصطناعي Language للكشف عن لغة هذه المراجعات؛ وقد يستجيب بالنتائج التالية:

المستند اسم اللغة رمز ISO 6391 النتيجة
التقييم 1 ‏‫الإنجليزية‬ en 1.0
التقييم 2 الإسبانية es 1.0
التقييم 3 ‏‫الإنجليزية‬ en 0.9

لاحظ أن اللغة المكتشفة للتقييم 3 هي الإنجليزية، على الرغم من أن النص يحتوي على مزيج من الإنجليزية والفرنسية. ستركز خدمة اكتشاف اللغة على اللغة السائدة في النص. تستخدم الخدمة خوارزمية لتحديد اللغة السائدة، مثل طول العبارات أو إجمالي كمية النص للغة مقارنة باللغات الأخرى في النص. ستكون اللغة السائدة هي القيمة التي يتم إرجاعها، جنبًا إلى جنب مع رمز اللغة. قد تكون درجة الثقة أقل من 1 نتيجة لنص اللغة المختلطة.

قد يكون هناك نص غامض بطبيعتها، أو يحتوي على محتوى لغة مختلطة. ويمكن أن تمثل هذه الحالات تحديا. ومن أمثلة المحتوى الغامض حالة يحتوي فيها المستند على نص محدود أو علامات ترقيم فقط. على سبيل المثال، يؤدي استخدام Azure الذكاء الاصطناعي Language لتحليل النص ":-)"، إلى قيمة غير معروفة لاسم اللغة ومعرف اللغة ودرجة NaN (التي تستخدم للإشارة إلى ليس رقما).

تحليل التوجه وجمع الآراء

يمكن لقدرات تحليلات النص في Azure الذكاء الاصطناعي Language تقييم النص وإرجاع درجات المشاعر والتسميات لكل جملة. هذه القدرة مفيدة للكشف عن التوجه الإيجابي والسلبي في وسائل التواصل الاجتماعي، وتقييمات العملاء، ومنتديات المناقشة وغيرها.

تستخدم Azure الذكاء الاصطناعي Language نموذج تصنيف التعلم الآلي الذي تم إنشاؤه مسبقا لتقييم النص. ترجع الخدمة درجات المشاعر في ثلاث فئات: إيجابية ومحايدة وسلبية. في كل فئة من الفئات، يتم توفير درجة بين 0 و1. تشير الدرجات إلى مدى احتمالية أن يكون النص المقدم توجها معينا. يتم أيضا توفير توجه مستند واحد.

على سبيل المثال، يمكن تحليل التقييمين التاليين للمطعم بالنسبة للتوجه:

مراجعة 1: "تناولنا العشاء في هذا المطعم الليلة الماضية وأول شيء لاحظته هو كيف كان فريق العمل مهذبا. تم استقبالنا بطريقة ودية وأخذنا إلى طاولتنا على الفور. كانت الطاولة نظيفة، كانت الكراسي مريحة، وكان الطعام مذهلا.

و

مراجعة 2: "كانت تجربة تناول الطعام لدينا في هذا المطعم واحدة من أسوأ ما كان لي في أي وقت مضى. كانت الخدمة بطيئة، والطعام كان مروعا. لن آكل أبدا في هذه المؤسسة مرة أخرى".

قد تكون درجة التوجه للمراجعة الأولى: مستند التوجه: درجة إيجابية إيجابية: .90 درجة محايدة: .10 درجة سلبية: .00

قد ترجع المراجعة الثانية استجابة: توجه المستند: درجة إيجابية سلبية: .00 درجة محايدة: .00 درجة سالبة: .99

استخراج العبارات الأساسية

يحدد استخراج العبارة الرئيسية النقاط الرئيسية من النص. انظر في سيناريو المطعم الذي جرت مناقشته سابقًا. إذا كان لديك عدد كبير من الاستطلاعات، فقد يستغرق الأمر وقتا طويلا لقراءة المراجعات. بدلا من ذلك، يمكنك استخدام إمكانيات استخراج العبارة الرئيسية الخاصة بخدمة Language لتلخيص النقاط الرئيسية.

قد تتلقى تقييمًا مثل:

"تناولنا العشاء هنا في احتفال بعيد ميلاد وكانت تجربة رائعة. تم الترحيب بنا من قبل مضيفة ودودة ونقلتنا إلى طاولتنا على الفور. كانت الأجواء مريحة والطعام كان مذهلاً وكانت الخدمة رائعة. إذا كنت تحب طعامًا رائعًا وخدمة سريعة، فعليك تجربة هذا المكان."

يمكن أن يوفر استخراج العبارات الرئيسية بعض السياق لهذا التقييم عن طريق استخراج العبارات التالية:

  • احتفال عيد ميلاد
  • تجربة رائعة
  • مضيفة ودودة
  • طعام رائع
  • خدمة يقظة
  • العشاء
  • طاولتنا
  • الأجواء
  • المكان

بالإضافة إلى استخدام تحليل المشاعر لتحديد أن هذه مراجعة إيجابية، يمكنك أيضا استخدام خدمة العبارة الرئيسية لتحديد العناصر المهمة للمراجعة.

إنشاء مورد للغة الذكاء الاصطناعي Azure

لاستخدام Azure الذكاء الاصطناعي Language في أحد التطبيقات، يجب توفير مورد مناسب في اشتراك Azure. يمكنك اختيار أي من أنواع الموارد التالية:

  • مورد Language - اختر نوع المورد هذا إذا كنت تخطط فقط لاستخدام خدمات Azure الذكاء الاصطناعي Language، أو إذا كنت تريد إدارة الوصول والفوترة للمورد بشكل منفصل عن الخدمات الأخرى.
  • مورد خدمات Azure الذكاء الاصطناعي - اختر نوع المورد هذا إذا كنت تخطط لاستخدام Azure الذكاء الاصطناعي Language بالاشتراك مع خدمات Azure الذكاء الاصطناعي الأخرى، وتريد إدارة الوصول والفوترة لهذه الخدمات معا.