ما المقصود بتلخيص المستند والمحادثة؟

هام

تعرض منطقة المعاينة الخاصة بنا، سويد سنترال، أحدث تقنيات ضبط LLM المتطورة باستمرار استنادا إلى نماذج GPT. نرحب بتجربتها باستخدام مورد Language في منطقة وسط السويد.

لا يتوفر ملخص المحادثة إلا باستخدام:

  • واجهة برمجة تطبيقات REST
  • Python
  • C#‎

التلخيص هو إحدى الميزات التي تقدمها Azure الذكاء الاصطناعي Language، وهي مجموعة من التعلم الآلي وخوارزميات الذكاء الاصطناعي في السحابة لتطوير التطبيقات الذكية التي تتضمن لغة مكتوبة. استخدم هذه المقالة لمعرفة المزيد حول هذه الميزة وكيفية استخدامها في تطبيقاتك.

على الرغم من أن الخدمات تسمى ملخص المستند والمحادثة، إلا أن تلخيص المستند يقبل كتل النص العادي فقط، ويقبل ملخص المحادثة العديد من أدوات الكلام حتى يتمكن النموذج من معرفة المزيد. إذا كنت تريد معالجة محادثة ولكنك تهتم بالنص فقط، فيمكنك استخدام تلخيص المستند لهذا السيناريو.

تحتوي هذه الوثائق على أنواع المقالات التالية:

يستخدم تلخيص المستندات تقنيات معالجة اللغة الطبيعية لإنشاء ملخص للمستندات. هناك ثلاثة أساليب مدعومة لواجهة برمجة التطبيقات للتلخيص التلقائي: الاستخراجية والتجريدية والتركيز على الاستعلام.

يستخرج التلخيص الاستخراجي الجمل التي تمثل بشكل جماعي أهم المعلومات أو ذات الصلة ضمن المحتوى الأصلي. ينشئ التلخيص التجريدي ملخصا يتضمن جملا أو كلمات موجزة ومتماسكة لا تستخرج جملا حرفية من المستند الأصلي. تم تصميم هذه الميزات لتقصير المحتوى الذي يمكن اعتباره طويلا جدا للقراءة.

دعم المستند الأصلي

يشير المستند الأصلي إلى تنسيق الملف المستخدم لإنشاء المستند الأصلي مثل Microsoft Word (docx) أو ملف مستند محمول (pdf). يلغي دعم المستند الأصلي الحاجة إلى المعالجة المسبقة للنص قبل استخدام قدرات مورد Azure الذكاء الاصطناعي Language. حاليا، يتوفر دعم المستند الأصلي لكل من قدرات AbstractiveSummarization و ExtractiveSummarization.

يدعم ملخص المستند حاليا تنسيقات المستندات الأصلية التالية:

نوع الملف امتداد الملف ‏‏الوصف
نص .txt مستند نصي غير منسق.
Adobe PDF .pdf مستند محمول بتنسيق ملف مستند.
Microsoft Word .docx ملف مستند Microsoft Word.

لمزيد من المعلومات، راجعاستخدام المستندات الأصلية لمعالجة اللغة

الميزات الرئيسية

هناك جوانب تلخيص المستند التي توفرها واجهة برمجة التطبيقات هذه:

  • التلخيص الاستخراجي: ينتج ملخصا عن طريق استخراج الجمل البارزة داخل المستند.

    • جمل مستخرجة متعددة: تنقل هذه الجمل بشكل جماعي الفكرة الرئيسية للمستند. إنها جمل أصلية مستخرجة من محتوى مستند الإدخال.
    • درجة التصنيف: تشير درجة التصنيف إلى مدى صلة أي جملة بالموضوع الرئيسي للمستند. يصنف تلخيص المستند الجمل المستخرجة، ويمكنك تحديد ما إذا كانت قد تم إرجاعها بالترتيب الذي تظهر به، أو وفقاً لتصنيفها.
    • جمل متعددة تم إرجاعها: حدد الحد الأقصى لعدد الجمل التي سيتم إرجاعها. على سبيل المثال، إذا طلبت تلخيصا استخراجيا ملخصا من ثلاث جمل، فترجع أعلى ثلاث جمل مسجلة.
    • معلومات موضعية: موضع البدء وطول الجمل المستخرجة.
  • التلخيص التجريدي: ينشئ ملخصا لا يستخدم نفس الكلمات كما هو الحال في المستند، ولكنه يلتقط الفكرة الرئيسية.

    • النصوص الموجزة: يقوم التلخيص المجردي بإرجاع ملخص لكل نطاق إدخال سياقي داخل المستند. يمكن تقسيم مستند طويل بحيث يمكن إرجاع مجموعات متعددة من النصوص الموجزة مع نطاق الإدخال السياقي.
    • نطاق الإدخال السياقي: النطاق داخل مستند الإدخال الذي تم استخدامه لإنشاء نص الملخص.
  • التلخيص الذي يركز على الاستعلام: إنشاء ملخص يستند إلى استعلام

على سبيل المثال، ضع في اعتبارك الفقرة التالية من النص:

"نحن في Microsoft نسعى إلى التقدم الذكاء الاصطناعي إلى ما هو أبعد من التقنيات الحالية، من خلال اتباع نهج أكثر شمولية يركز على الإنسان للتعلم والتفاهم. بصفتي كبير مسؤولي التكنولوجيا في خدمات Azure الذكاء الاصطناعي، عملت مع فريق من العلماء والمهندسين المذهلين لتحويل هذا الطلب إلى حقيقة واقعة. أتمتع بدوري بمنظور فريد في عرض العلاقة بين ثلاث سمات للإدراك البشري: نص أحاديّ اللّغة (X)، والإشارات الحسية الصوتية أو المرئية، (Y) واللغات المتعددة (Z). عند تقاطع الثلاثة، هناك سحر - ما نسميه رمز XYZ كما هو موضح في الشكل 1 - تمثيل مشترك لإنشاء الذكاء الاصطناعي أكثر قوة يمكنه التحدث وسماع ورؤية وفهم البشر بشكل أفضل. نعتقد أن XYZ-code يمكننا من تحقيق رؤيتنا طويلة الأجل: التعلم عبر المجالات، وطرائق واللغات الممتدة. الهدف من ذلك هو الحصول على نماذج مُدربة مسبقًا يمكنها تعلم التمثيلات بشكل مشترك لدعم مجموعة واسعة من مهام الذكاء الاصطناعي في المراحل النهائية والكثير مما يفعله البشر اليوم. على مدى السنوات الخمس الماضية، حققنا الأداء البشري على معايير في التعرف على الكلام للمحادثة، والترجمة الآلية، والإجابة على سؤال المحادثة، وإدراك القراءة الآلية، والتسمية التوضيحية للصور. وقد وفرت لنا هذه الاكتشافات الخمسة إشارات قوية نحو أكثر تطلعاتنا طموحًا لتحقيق نقلة في قدرات الذكاء الاصطناعي، وتحقيق التعلم متعدد الحواس واللغات الذي يتماشى مع كيفية تعلم البشر وفهمهم. أعتقد أن رمز XYZ المشترك هو مكوّن أساسي لهذا الطموح، إذا كان مستندًا إلى مصادر معارف خارجية في مهام الذكاء الاصطناعي في المراحل النهائية."

تتم معالجة طلب واجهة برمجة تطبيقات تلخيص المستند عند استلام الطلب عن طريق إنشاء مهمة للواجهة الخلفية لواجهة برمجة التطبيقات. إذا نجحت المهمة، يتم إرجاع إخراج واجهة برمجة التطبيقات. الإخراج متاح للاسترداد لمدة 24 ساعة. يُمسح الإخراج بعد هذا الوقت. نظرا لدعم اللغات المتعددة والرموز التعبيرية، يمكن أن تحتوي الاستجابة على إزاحات نصية. لمزيد من المعلومات، راجع كيفية معالجة الإزاحات.

إذا استخدمنا المثال أعلاه، فقد ترجع واجهة برمجة التطبيقات هذه الجمل الملخصة:

التلخيص الاستخراجي:

  • "في Microsoft، نحن نسعى إلى التقدم الذكاء الاصطناعي إلى ما هو أبعد من التقنيات الحالية، من خلال اتباع نهج أكثر شمولية يركز على الإنسان للتعلم والتفاهم."
  • "نعتقد أن XYZ-code يمكننا من تحقيق رؤيتنا طويلة الأجل: التعلم عبر المجالات، وطرائق واللغات الممتدة."
  • "الهدف هو أن يكون لديك نماذج مدربة مسبقا يمكنها أن تتعلم بشكل مشترك تمثيلات لدعم مجموعة واسعة من مهام الذكاء الاصطناعي المصب، والكثير في الطريقة التي يفعلها البشر اليوم."

تلخيص تجريدي:

  • "تتخذ Microsoft نهجا أكثر شمولية يركز على الإنسان للتعلم والفهم. نعتقد أن XYZ-code يمكننا من تحقيق رؤيتنا طويلة الأجل: التعلم عبر المجالات، وطرائق واللغات الممتدة. على مدى السنوات الخمس الماضية، حققنا الأداء البشري على معايير في التعرف على الكلام للمحادثة".

بدء استخدام التلخيص

لاستخدام التلخيص، يمكنك إرسال للتحليل ومعالجة إخراج واجهة برمجة التطبيقات في التطبيق الخاص بك. يتم إجراء التحليل كما هو، مع عدم وجود تخصيص إضافي للنموذج المستخدم على بياناتك. تتوافر طريقتان لاستخدام التلخيص:

خيار التطوير ‏‏الوصف
استوديو اللغة Language Studio هو نظام أساسي مستند إلى الويب يتيح لك محاولة ربط الكيان بأمثلة نصية بدون حساب Azure، وبياناتك الخاصة عند التسجيل. لمزيد من المعلومات، راجع موقع ويب Language Studio أو التشغيل السريع لاستوديو اللغة.
واجهة برمجة تطبيقات REST أو مكتبة العميل (Azure SDK) دمج ملخص المستند في تطبيقاتك باستخدام واجهة برمجة تطبيقات REST، أو مكتبة العميل المتوفرة بلغات مختلفة. لمزيد من المعلومات، راجع التشغيل السريع للملخص.

متطلبات الإدخال وحدود الخدمة

  • يتطلب التلخيص النص للتحليل. لمزيد من المعلومات، راجع حدود البيانات والخدمة في دليل الكيفية.
  • يعمل التلخيص مع مختلف اللغات المكتوبة. لمزيد من المعلومات، راجع دعم اللغة.

الوثائق المرجعية وعينات التعليمات البرمجية

أثناء استخدام تلخيص المستند في تطبيقاتك، راجع الوثائق المرجعية والعينات التالية للغة الذكاء الاصطناعي Azure:

خيار التطوير / اللغة الوثائق المرجعية العينات
C#‎ وثائق C#‎ عينات C#‎
Java وثائق Java نماذج Java
JavaScript وثائق JavaScript نماذج JavaScript
Python وثائق Python عينات Python

الذكاء الاصطناعي المسؤول

لا يتضمن نظام الذكاء الاصطناعي التقنية فحسب، بل يشمل أيضا الأشخاص الذين يستخدمونها، والأشخاص المتأثرين بها، وبيئة النشر. اقرأ ملاحظة الشفافية للتلخيص للتعرف على الاستخدام المسؤول للذكاء الاصطناعي وتوزيعه في الأنظمة الخاصة بك. لمزيد من المعلومات، راجع المقالات التالية: