دعم اللغة لتصنيف النص المخصص

استخدم هذه المقالة للتعرف على اللغات المدعومة حالياً بواسطة ميزة تصنيف النص المخصص.

خيار متعدد اللغات

باستخدام تصنيف النص المخصص، يمكنك تدريب نموذج بلغة واحدة واستخدامه لتصنيف المستندات بلغة أخرى. هذه الميزة مفيدة لأنها تساعد في توفير الوقت والجهد. يمكنك التعامل مع مجموعة بيانات متعدد اللغات في مشروع واحد، بدلاً من إنشاء مشاريع منفصلة لكل لغة. ليس من الضروري أن تكون مجموعة البيانات الخاصة بك باللغة ذاتها بالكامل ولكن يجب عليك تمكين الخيار متعدد اللغات لمشروعك أثناء الإنشاء أو القيام بذلك لاحقاً في إعدادات المشروع. فكر في إضافة المزيد من البيانات بهذه اللغات إلى مجموعة التدريب الخاصة بك، إذا لاحظت أن أداء النموذج الخاص بك ضعيفاً في لغات معينة أثناء عملية التقييم.

يمكنك تدريب مشروعك بالكامل باستخدام مستندات باللغة الإنجليزية، والاستعلام عنه باللغات: الفرنسية والألمانية والماندراين الصينية واليابانية والكورية وغيرها. يُسهل تصنيف النص المخصص عليك توسيع نطاق مشروعاتك إلى لغات متعددة باستخدام تقنية متعدد اللغات لتدريب النماذج الخاصة بك.

عندما تحدد أن لغة معينة لا تؤدي أداءً مثل اللغات الأخرى، يمكنك إضافة المزيد من المستندات لتلك اللغة في مشروعك. في صفحة وصف البيانات في Language Studio، يمكنك تحديد لغة المستند الذي تقوم بإضافته. عند تقديم المزيد من المستندات خاصة بتلك اللغة إلى النموذج، يتم تقديمه إلى المزيد من بناء جملة تلك اللغة، ويتعلم كيفية التنبؤ بها بشكل أفضل.

لا يُتوقع منك إضافة نفس العدد من المستندات لكل لغة. يجب إنشاء غالبية مشروعك بلغة واحدة، وإضافة بعض المستندات فقط باللغات التي تلاحظ أنها لا تؤدي بشكل جيد. إذا أنشأت مشروعاً باللغة الإنجليزية بشكل أساسي، وبدأت في اختباره باللغة الفرنسية والألمانية والإسبانية، فقد تلاحظ أن اللغة الألمانية لا تعمل مثل اللغتين الأخريين. في هذه الحالة، ضع في اعتبارك إضافة 5٪ من مستنداتك الإنجليزية الأصلية باللغة الألمانية، وقم بتدريب نموذج جديد واختباره باللغة الألمانية مرة أخرى. يجب أن ترى نتائج أفضل للاستعلامات باللغة الألمانية. كلما أضفت المزيد من المستندات المسماة، زادت احتمالية تحسن النتائج.

عند إضافة بيانات بلغة أخرى، يجب ألا تتوقع أن يكون لها تأثير سلبي على اللغات الأخرى.

اللغات المدعومة بتصنيف النص المخصص

يدعم تصنيف النص المخصص ملفات .txt باللغات التالية:

اللغة رمز اللغة
الأفريقانية af
الأمهرية am
العربية ar
الأساميزية as
الأذربيجانية az
البيلاروسية be
البلغارية bg
البنغالية bn
بريتونية br
البوسنية bs
الكتالانية ca
التشيكية cs
الولشية cy
الدانماركية da
الألمانية de
اليونانية el
English (US) en-us
الإسبرانتو eo
الإسبانية es
الإستونية et
الباسكية eu
الفارسية (الفارسية) fa
الفنلندية fi
الفرنسية fr
الفريزية الغربية fy
الأيرلندية ga
الغيلية الاسكتلندية gd
الجاليشية gl
الجيوجاراتية gu
الهوسا ha
العبرية he
الهندية hi
الكرواتية hr
المجرية hu
الأرمينية hy
الإندونيسية id
الإيطالية it
اليابانية ja
الجاوية jv
الجورجية ka
الكازاخستانية kk
الخميرية km
الكنادية kn
‏‏الكورية ko
الكردية (الكرمانجية) ku
القيرقيزية ky
لاتينيه la
اللاوو lo
الليتوانية lt
اللاتفية lv
الملغاشي mg
المقدونية mk
المالايالامية ml
المنغولية mn
الماراثية mr
الماليزية ms
البورميه my
النيبالية ne
الهولندية nl
لغة بوكمال النرويجية nb
الأوريا or
البنجابية pa
البولندية pl
الباشتو ps
البرتغالية (البرازيل) pt-br
البرتغالية (البرتغال) pt-pt
الرومانية ro
الروسية ru
السنسكريتية sa
السنديه sd
السنهالية si
السلوفاكية sk
السلوفينية sl
الصومالية so
الألبانية sq
الصربية sr
السوندية su
السويدية sv
السواحلية sw
التاميلية ta
تيلوجو te
التايلاندية th
الفلبينية tl
التركية tr
الأويغورية ug
الأوكرانية uk
الأردية ur
الأوزبكية uz
الفيتنامية vi
الكوسية xh
اليديشية yi
الصينية (مبسطة) zh-hans
الزولوية zu

الخطوات التالية