مشاركة عبر


تحليل المحتوى أو تقسيمه لمهام سير العمل في Azure Logic Apps

ينطبق على: Azure Logic Apps (الاستهلاك + قياسي)

في بعض الأحيان، يجب عليك تحويل المحتوى إلى رموز مميزة، وهي عبارة عن كلمات أو مجموعات من الأحرف، أو تقسيم مستند كبير إلى أجزاء أصغر قبل أن تتمكن من استخدام هذا المحتوى مع بعض الإجراءات. على سبيل المثال، تتوقع إجراءات Azure الذكاء الاصطناعي Search أو Azure OpenAI إدخالا مميزا ويمكنها التعامل مع عدد محدود فقط من الرموز المميزة.

بالنسبة لهذه السيناريوهات، استخدم إجراءات عمليات البيانات المسماة تحليل مستند ونص مجموعة في سير عمل تطبيق المنطق. تقوم هذه الإجراءات على التوالي بتحويل المحتوى، مثل مستند PDF وملف CSV وملف Excel وما إلى ذلك، إلى إخراج سلسلة مميزة ثم تقسيم السلسلة إلى أجزاء، استنادا إلى عدد الرموز المميزة. يمكنك بعد ذلك الرجوع إلى هذه المخرجات واستخدامها مع الإجراءات اللاحقة في سير العمل الخاص بك.

تلميح

لمعرفة المزيد، يمكنك طرح الأسئلة التالية على Azure Copilot:

  • ما هو الرمز المميز في الذكاء الاصطناعي؟
  • ما هو الإدخال المميز؟
  • ما هو إخراج السلسلة المميزة؟
  • ما هو التحليل في الذكاء الاصطناعي؟
  • ما هو التقسيم في الذكاء الاصطناعي؟

للعثور على Azure Copilot، في شريط أدوات مدخل Microsoft Azure، حدد Copilot.

يوضح دليل الكيفية هذا كيفية إضافة هذه العمليات وإعدادها في سير العمل.

المشكلات المعروفة والقيود

لا يدعم تحليل المستند والإجراءات النصية المقسمة حاليا ملفات المضيف، على سبيل المثال، الملفات الثنائية المركزية والمتوسطة مثل ملفات أسلوب الوصول إلى التخزين الظاهري (VSAM). ومع ذلك، إذا كنت تعمل مع مهام سير العمل القياسية، يمكنك استخدام الإجراء المضمن لملف مضيف IBM المسمى Parse Host File Contents بدلا من ذلك.

المتطلبات الأساسية

  • حساب واشتراك Azure. إذا لم يكن لديك اشتراك، فقم بالتسجيل للحصول على حساب Azure مجاني.

  • سير عمل Consumption أو Standard logic app مع مشغل موجود لأن تحليل المستند وعمليات نص المجموعة متوفرة فقط كإجراءات. تأكد من أن الإجراء الذي يسترد المحتوى الذي تريد تحليله أو جزء يسبق عمليات البيانات هذه.

تحليل مستند

يقوم إجراء تحليل مستند بتحويل المحتوى، مثل مستند PDF وملف CSV وملف Excel وما إلى ذلك، إلى سلسلة مميزة. على سبيل المثال، افترض أن سير العمل يبدأ بمشغل الطلب المسمى عند تلقي طلب HTTP. ينتظر هذا المشغل لتلقي طلب HTTP المرسل من مكون آخر، مثل دالة Azure وسير عمل تطبيق منطقي آخر وما إلى ذلك. يتضمن طلب HTTP عنوان URL لمستند جديد تم تحميله متوفرا لسير العمل لاسترداده وتحليله. يتبع إجراء HTTP المشغل مباشرة، ويرسل طلب HTTP إلى عنوان URL للمستند، ويرجع مع محتوى المستند من موقع التخزين الخاص به.

إذا كنت تستخدم مصادر محتوى أخرى، مثل Azure Blob Storage وSharePoint وOneDrive ونظام الملفات وFTP وما إلى ذلك، يمكنك التحقق مما إذا كانت المشغلات متوفرة لهذه المصادر. يمكنك أيضا التحقق مما إذا كانت الإجراءات متوفرة لاسترداد المحتوى لهذه المصادر. لمزيد من المعلومات، راجع العمليات المضمنة والموصلات المدارة.

  1. في مدخل Microsoft Azure، افتح مورد وسير عمل التطبيق المنطقي في المُصمم.

  2. ضمن المشغل والإجراءات الموجودة، اتبع هذه الخطوات العامة لإضافة إجراء عمليات البيانات المسمى تحليل مستند إلى سير العمل.

  3. على المصمم، حدد إجراء تحليل مستند .

  4. بعد فتح جزء معلومات الإجراء، في علامة التبويب معلمات ، في الخاصية محتوى المستند، حدد المحتوى المراد تحليله باتباع الخطوات التالية:

    1. حدد داخل المربع محتوى المستند.

      تظهر خيارات قائمة المحتوى الديناميكي (أيقونة البرق) ومحرر التعبير (أيقونة الدالة).

      • لاختيار الإخراج من إجراء سابق، حدد قائمة المحتوى الديناميكي.

      • لإنشاء تعبير يعالج الإخراج من إجراء سابق، حدد محرر التعبير.

      يستمر هذا المثال عن طريق تحديد أيقونة البرق لقائمة المحتوى الديناميكي.

    2. بعد فتح قائمة المحتوى الديناميكي، حدد الإخراج الذي تريده من عملية سابقه.

      في هذا المثال، يشير إجراء تحليل مستند إلى إخراج النص الأساسي من إجراء HTTP .

      تظهر لقطة الشاشة مصمم سير العمل، الذي يحتوي على إجراء يسمى تحليل مستند مع قائمة محتوى ديناميكية مفتوحة وإخراج النص الأساسي المحدد من إجراء HTTP.

      يظهر إخراج النص الأساسي الآن في المربع محتوى المستند:

      تظهر لقطة الشاشة نموذج سير العمل مع إخراج النص الأساسي في الإجراء المسمى تحليل مستند.

  5. ضمن إجراء تحليل مستند، أضف الإجراءات التي تريد العمل بها مع إخراج السلسلة المميزة، على سبيل المثال، نص المجموعة، الذي يصفه هذا الدليل لاحقا.

تحليل مستند - مرجع

المعلمات

الاسم القيمة‬ نوع البيانات ‏‏الوصف الحد
محتوى المستند < تحويل المحتوى إلى تحليل> أي المحتوى المراد تحليله. بلا

المخرجات

الاسم نوع البيانات ‏‏الوصف
نص النتيجة التي تم تحليلها صفيف سلسلة صفيف خاص بالسلاسل.
النتيجة التي تم تحليلها ‏‏الكائن كائن يحتوي على النص الذي تم تحليله بالكامل.

جزء من النص

يقسم إجراء نص المجموعة المحتوى إلى أجزاء أصغر للإجراءات اللاحقة لاستخدامها بسهولة أكبر في سير العمل الحالي. تعتمد الخطوات التالية على المثال من قسم تحليل مستند وتقسيم إخراج سلسلة الرمز المميز للاستخدام مع عمليات Azure الذكاء الاصطناعي التي تتوقع مجموعات محتوى رمزية وصغيرة.

إشعار

لا تؤثر الإجراءات السابقة التي تستخدم التقسيم على إجراء نص المجموعة، كما لا يؤثر الإجراء النصي للمجموعة على الإجراءات اللاحقة التي تستخدم التقسيم.

  1. في مدخل Microsoft Azure، افتح مورد وسير عمل التطبيق المنطقي في المُصمم.

  2. ضمن إجراء تحليل مستند، اتبع هذه الخطوات العامة لإضافة إجراء عمليات البيانات المسمى نص المجموعة.

  3. على المصمم، حدد إجراء نص المجموعة.

  4. بعد فتح جزء معلومات الإجراء، في علامة التبويب Parameters ، للخاصية Chunking Strategy ، حدد TokenSize كأسلوب تقسيم، إذا لم يكن محددا بالفعل.

    الاستراتيجية ‏‏الوصف
    حجم الرمز المميز تقسيم المحتوى المحدد، استنادا إلى عدد الرموز المميزة.
  5. بعد تحديد الاستراتيجية، حدد داخل مربع النص لتحديد المحتوى الخاص بالتقسيم.

    تظهر خيارات قائمة المحتوى الديناميكي (أيقونة البرق) ومحرر التعبير (أيقونة الدالة).

    • لاختيار الإخراج من إجراء سابق، حدد قائمة المحتوى الديناميكي.

    • لإنشاء تعبير يعالج الإخراج من إجراء سابق، حدد محرر التعبير.

    يستمر هذا المثال عن طريق تحديد أيقونة البرق لقائمة المحتوى الديناميكي.

    1. بعد فتح قائمة المحتوى الديناميكي، حدد الإخراج الذي تريده من عملية سابقه.

      في هذا المثال، يشير إجراء النص Chunk إلى إخراج نص النتيجة Parsed من إجراء تحليل مستند .

      تظهر لقطة الشاشة مصمم سير العمل، والإجراء المسمى Chunk text مع قائمة محتوى ديناميكية مفتوحة، وإخراج محدد من تحليل إجراء مستند.

      يعرض مربع النص الآن إخراج إجراء النتيجة التي تم تحليلها:

      تظهر لقطة الشاشة نموذج سير العمل مع إخراج نص نتيجة محدد تم تحليله في الإجراء المسمى Chunk text.

  6. أكمل إعداد إجراء نص المجموعة، استنادا إلى الاستراتيجية والسيناريو المحددين. لمزيد من المعلومات، راجع نص المجموعة - مرجع.

الآن، عند إضافة إجراءات أخرى تتوقع الإدخال المميز وتستخدمه، مثل إجراءات Azure الذكاء الاصطناعي، يتم تنسيق محتوى الإدخال لتسهيل الاستهلاك.

نص المجموعة - مرجع

المعلمات

الاسم القيمة‬ نوع البيانات ‏‏الوصف الحدود
استراتيجية التقسيم حجم الرمز المميز قائمة تعداد السلسلة تقسيم المحتوى، استنادا إلى عدد الرموز المميزة.

الافتراضي: حجم الرمز المميز
غير قابل للتطبيق
نص < المحتوى إلى المجموعة> أي المحتوى المراد تقسيمه. راجع الدليل المرجعي للحدود والتكوين
EncodingModel < أسلوب الترميز> قائمة تعداد السلسلة نموذج الترميز المراد استخدامه:

- الافتراضي: cl100k_base (gpt4، gpt-3.5-turbo، gpt-35-turbo)

- r50k_base (GPT-3)

- p50k_base (GPT-3)

- p50k_edit (GPT-3)

- cl200k_base (GPT-4O)

لمزيد من المعلومات، راجع نظرة عامة على OpenAI - النماذج.
غير قابل للتطبيق
حجم الرمز المميز < الحد الأقصى للرمز المميز لكل جزء> رقم صحيح الحد الأقصى لعدد الرموز المميزة لكل مجموعة محتوى.

الافتراضي: بلا
الحد الأدنى: 1
الحد الأقصى: 8000
PageOverlapLength < عدد الأحرف المتراكبة> رقم صحيح عدد الأحرف من نهاية المجموعة السابقة لتضمينها في المجموعة التالية. يساعدك هذا الإعداد على تجنب فقدان المعلومات المهمة عند تقسيم المحتوى إلى مجموعات والحفاظ على الاستمرارية والسياق عبر المجموعات.

الافتراضي: 0 - لا توجد أحرف متداخلة.
الحد الأدنى: 0

تلميح

لمعرفة المزيد، يمكنك طرح الأسئلة التالية على Azure Copilot:

  • ما هو PageOverlapLength في التقسيم؟
  • ما هو الترميز في Azure الذكاء الاصطناعي؟

للعثور على Azure Copilot، في شريط أدوات مدخل Microsoft Azure، حدد Copilot.

المخرجات

الاسم نوع البيانات ‏‏الوصف
عناصر نص النتيجة المكتنزة صفيف سلسلة صفيف خاص بالسلاسل.
عنصر عناصر نص النتيجة المكتنزة السلسلة‬ سلسلة واحدة في الصفيف.
نتيجة متقسيمة ‏‏الكائن كائن يحتوي على النص المكتمل بالكامل.

مثال على سير العمل

يتضمن المثال التالي إجراءات أخرى تنشئ نمط سير عمل كاملا لاستيعاب البيانات من أي مصدر:

تظهر لقطة الشاشة نموذج سير العمل الكامل.

الخطوة مهمة العملية الأساسية ‏‏الوصف
1 انتظر أو تحقق من وجود محتوى جديد. عند تلقي طلب HTTP مشغل يقوم إما باستطلاع أو انتظار وصول بيانات جديدة، إما بناء على تكرار مجدول أو استجابة لأحداث معينة على التوالي. قد يكون مثل هذا الحدث ملفا جديدا يتم تحميله إلى نظام تخزين معين، مثل Azure Blob Storage وSharePoint وOneDrive ونظام الملفات وFTP وما إلى ذلك.

في هذا المثال، تنتظر عملية مشغل الطلب طلب HTTP أو HTTPS المرسل من نقطة نهاية أخرى. يتضمن الطلب عنوان URL لمستند جديد تم تحميله.
2 احصل على المحتوى. HTTP إجراء HTTP الذي يسترد المستند الذي تم تحميله باستخدام عنوان URL للملف من إخراج المشغل.
3 إنشاء تفاصيل المستند. ألف إجراء عمليات البيانات الذي تسلسل عناصر مختلفة.

يسلسل هذا المثال معلومات قيمة المفتاح حول المستند.
4 إنشاء سلسلة الرمز المميز. تحليل مستند إجراء عمليات البيانات الذي ينتج سلسلة مميزة باستخدام الإخراج من إجراء الإنشاء.
5 إنشاء مجموعات المحتوى. جزء من النص إجراء عمليات البيانات الذي يقسم سلسلة الرمز المميز إلى أجزاء، استنادا إلى عدد الرموز المميزة لكل مجموعة محتوى.
6 تحويل النص المميز والمقطع إلى JSON. تحليل JSON إجراء عمليات البيانات الذي يحول الإخراج المقسم إلى صفيف JSON.
7 حدد عناصر صفيف JSON. Select إجراء عمليات البيانات الذي يحدد عناصر متعددة من صفيف JSON.
8 إنشاء التضمينات. الحصول على تضمينات متعددة إجراء Azure OpenAI الذي ينشئ عمليات تضمين لكل عنصر صفيف JSON.
9 حدد التضمينات والمعلومات الأخرى. Select إجراء عمليات البيانات الذي يحدد عمليات التضمين ومعلومات المستند الأخرى.
10 فهرسة البيانات. فهرسة المستندات إجراء Azure الذكاء الاصطناعي Search الذي يقوم بفهرسة البيانات استنادا إلى كل تضمين محدد.