متطلبات وقيود النماذج في Microsoft Syntex

ينطبق على: ✓ جميع النماذج المخصصة | ✓ جميع النماذج التي تم إنشاؤها مسبقا

يتيح لك Microsoft Syntex إنشاء نماذج مخصصة ونماذج تم إنشاؤها مسبقا. اعتمادا على نوع النموذج الذي تختاره، قد تكون هناك متطلبات مختلفة، مثل نوع الملف وحجمه واللغات التي تحتاج إلى الدعم والاعتبارات الجغرافية والعوامل الأخرى التي ستساعدك على تحديد نوع النموذج الذي يجب استخدامه.

النماذج المخصصة:

النماذج التي تم إنشاؤها مسبقا:

نماذج مخصصة

معالجة المستندات غير المنظمة

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: .csv، .doc، .docx، .eml، .heic، .heif، .htm، .html، .jpeg، .jpg، .md، .msg، .pdf، .png، .ppt، .pptx، .rtf، .tif، .tiff، .txt، .xls، .xlsx ( لا يتم تشغيل الصيغ في ملفات .xls .xlsx).
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج جميع اللغات اللاتينية، بما في ذلك: الإنجليزية والفرنسية والألمانية والإيطالية والإسبانية.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بالمتطلبات التالية:
- تنسيق ملف .jpg أو .png أو .pdf (نص أو ممسوح ضوئيا). تعد ملفات .pdf المضمنة في النص أفضل، لأنه لن تكون هناك أي أخطاء في استخراج الأحرف والموقع.
- إذا كانت ملفات .pdf مؤمنة بكلمة مرور، فيجب عليك إزالة التأمين قبل إرسالها.
- يجب ألا يتجاوز حجم الملف المجمع للمستندات المستخدمة للتدريب لكل مجموعة 50 ميغابايت، ويجب ألا تحتوي مستندات PDF على أكثر من 500 صفحة.
- بالنسبة للصور، يجب أن تتراوح الأبعاد بين 50 × 50 و10000 × 10000 بكسل. قد يتم اقتطاع الصور واسعة جدا أو ذات أبعاد فردية (على سبيل المثال، خطط الأرضية) في عملية التعرف البصري على الحروف وتفقد الدقة.
- بالنسبة للملفات .pdf، يجب أن تكون الأبعاد على الأكثر 11 × 17 بوصة، مطابقة لأحجام الورق القانونية أو A3 وأصغر.
- إذا تم مسحها ضوئيا من المستندات الورقية، يجب أن تكون عمليات الفحص صور عالية الجودة.
- يجب استخدام الأبجدية اللاتينية (الأحرف الإنجليزية).
لاحظ الاختلافات التالية حول الملفات المستندة إلى نص Microsoft Office والملفات الممسوحة ضوئيا بواسطة التعرف البصري على الحروف (.pdf أو الصورة أو .tiff):
- كافة الملفات: مقتطعة ب 64000 حرف (في التدريب وعند تشغيلها مقابل الملفات في مكتبة مستندات).
- الملفات الممسوحة ضوئيا بمسح التعرف البصري على الحروف: هناك حد 500 صفحة. تتم معالجة أنواع ملفات PDF والصور فقط بواسطة التعرف البصري على الحروف.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط.

معالجة المستندات بشكل حر

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: راجع متطلبات نوع الملف.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج اللغات التالية: راجع نموذج للمستندات العامة.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بهذه المتطلبات.
رمز النطاق الترددي/الكفاءة. تلميحات التحسين
إذا كان النموذج الخاص بك لا يعمل كما تريد، فجرب هذه الخطوات لتحسين أداء النموذج الخاص بك.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز كتل. بيئات Power Platform المخصصة
إذا كنت تستخدم بيئة مخصصة (بدلا من البيئة الافتراضية) لمعالجة Power Platform، فهناك متطلبات إعداد إضافية. لمزيد من المعلومات، راجع بيئات Power Platform المخصصة.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط. يمكنك الحصول على نموذج حر واحد فقط أو نموذج منظم واحد لكل مكتبة.

معالجة المستندات المنظمة

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: راجع متطلبات نوع الملف.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج اللغات التالية: راجع نموذج لمستندات القالب الثابت.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بهذه المتطلبات.
رمز النطاق الترددي/الكفاءة. تلميحات التحسين
إذا كان النموذج الخاص بك لا يعمل كما تريد، فجرب هذه الخطوات لتحسين أداء النموذج الخاص بك.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز كتل. بيئات Power Platform المخصصة
إذا كنت تستخدم بيئة مخصصة (بدلا من البيئة الافتراضية) لمعالجة Power Platform، فهناك متطلبات إعداد إضافية. لمزيد من المعلومات، راجع بيئات Power Platform المخصصة.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط. يمكنك الحصول على نموذج حر واحد فقط أو نموذج منظم واحد لكل مكتبة.

نماذج تم إنشاؤها مسبقا

معالجة العقد

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: .bmp .jpeg .pdf .png .tiff.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج عقود اللغة الإنجليزية فقط.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بالمتطلبات التالية:
- تنسيق ملف .jpg أو .png أو .pdf (نص أو ممسوح ضوئيا). تعد ملفات .pdf المضمنة في النص أفضل، لأنه لن تكون هناك أي أخطاء في استخراج الأحرف والموقع.
- بالنسبة .pdf والملفات .tiff، يمكن معالجة ما يصل إلى 2000 صفحة.
- يجب أن يكون حجم الملف أقل من 50 ميغابايت.
- بالنسبة للصور، يجب أن تتراوح الأبعاد بين 50 × 50 و10000 × 10000 بكسل.
- بالنسبة للملفات .pdf، يجب أن تكون الأبعاد على الأكثر 11 × 17 بوصة، مطابقة لأحجام الورق القانونية أو A3 وأصغر.
- الحجم الإجمالي لبيانات التدريب هو 500 صفحة أو أقل.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط.

معالجة الفاتورة

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: .bmp .jpeg .pdf .png .tiff.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج الفواتير باللغات الإنجليزية والإسبانية والألمانية والفرنسية والإيطالية والبرتغالية والهولندية.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بالمتطلبات التالية:
- تنسيق ملف .jpg أو .png أو .pdf (نص أو ممسوح ضوئيا). تعد ملفات .pdf المضمنة في النص أفضل، لأنه لن تكون هناك أي أخطاء في استخراج الأحرف والموقع.
- بالنسبة .pdf والملفات .tiff، يمكن معالجة ما يصل إلى 2000 صفحة.
- يجب أن يكون حجم الملف أقل من 50 ميغابايت.
- بالنسبة للصور، يجب أن تتراوح الأبعاد بين 50 × 50 و10000 × 10000 بكسل.
- بالنسبة للملفات .pdf، يجب أن تكون الأبعاد على الأكثر 11 × 17 بوصة، مطابقة لأحجام الورق القانونية أو A3 وأصغر.
- الحجم الإجمالي لبيانات التدريب هو 500 صفحة أو أقل.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط.

معالجة الإيصالات

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: .bmp .jpeg .pdf .png .tiff.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج الإيصالات باللغة الإنجليزية، والاحتراق، والتشيكية، والدانمركية، والهولندية، والنلندية، والألمانية، والمجرية، والإيطالية، واليابانية، واللاتفية، والليتواني، والنرويجية، والبرتغالية، والإسبانية، والسويدية، والفييتنامية.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بالمتطلبات التالية:
- تنسيق ملف .jpg أو .png أو .pdf (نص أو ممسوح ضوئيا). تعد ملفات .pdf المضمنة في النص أفضل، لأنه لن تكون هناك أي أخطاء في استخراج الأحرف والموقع.
- بالنسبة .pdf والملفات .tiff، يمكن معالجة ما يصل إلى 2000 صفحة.
- يجب أن يكون حجم الملف أقل من 50 ميغابايت.
- بالنسبة للصور، يجب أن تتراوح الأبعاد بين 50 × 50 و10000 × 10000 بكسل.
- بالنسبة للملفات .pdf، يجب أن تكون الأبعاد على الأكثر 11 × 17 بوصة، مطابقة لأحجام الورق القانونية أو A3 وأصغر.
- الحجم الإجمالي لبيانات التدريب هو 500 صفحة أو أقل.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط.

معالجة المعلومات الحساسة

رمز الوصف
رمز الملفات. أنواع الملفات المعتمدة
يدعم هذا النموذج أنواع الملفات التالية: .csv، .doc، .docx، .eml، .heic، .heif، .htm، .html، .jpeg، .jpg، .md، .msg، .pdf، .png، .ppt، .pptx، .rtf، .tif، .tiff، .txt، .xls، .xlsx.
رمز المحادثة. اللغات المدعومة
يدعم هذا النموذج اللغات التالية: راجع اللغات المدعومة.
يدعم هذا النموذج أيضا لغات لكل من النص المكتوب بخط اليدوطباعة النص.
رمز الفقرة. اعتبارات التعرف البصري على الحروف
يستخدم هذا النموذج تقنية التعرف البصري على الأحرف (OCR) لفحص الملفات .pdf وملفات الصور وملفات .tiff. تعمل معالجة التعرف البصري على الحروف بشكل أفضل على المستندات التي تفي بالمتطلبات التالية:
- تنسيق ملف .jpg أو .png أو .pdf (نص أو ممسوح ضوئيا). تعد ملفات .pdf المضمنة في النص أفضل، لأنه لن تكون هناك أي أخطاء في استخراج الأحرف والموقع.
- بالنسبة .pdf والملفات .tiff، يمكن معالجة ما يصل إلى 2000 صفحة.
- يجب أن يكون حجم الملف أقل من 50 ميغابايت.
- بالنسبة للصور، يجب أن تتراوح الأبعاد بين 50 × 50 و10000 × 10000 بكسل.
- بالنسبة للملفات .pdf، يجب أن تكون الأبعاد على الأكثر 11 × 17 بوصة، مطابقة لأحجام الورق القانونية أو A3 وأصغر.
- الحجم الإجمالي لبيانات التدريب هو 500 صفحة أو أقل.
يدعم اللغات لكل من النص المكتوب بخط اليدوطباعة النص.
رمز الكرة الأرضية. بيئات متعددة المواقع الجغرافية
عند إعداد Syntex في بيئة Microsoft 365 Multi-Geo ، يمكنك فقط تكوينه لاستخدام نوع النموذج في الموقع المركزي. إذا كنت تريد استخدام نوع النموذج هذا في موقع قمر صناعي، فاتصل بدعم Microsoft.
رمز الكائنات. مكتبات متعددة النماذج
إذا تم تطبيق نموذجين أو أكثر من النماذج المدربة على نفس المكتبة، يتم تصنيف الملف باستخدام النموذج الذي يحتوي على أعلى متوسط درجة ثقة. ستكون الكيانات المستخرجة من النموذج المطبق فقط.