SplitSkill interface

مهارة لتقسيم سلسلة إلى أجزاء من النص.

يمتد

الخصائص

defaultLanguageCode

قيمة تشير إلى رمز اللغة الذي يجب استخدامه. القيمة الافتراضية هي en.

maximumPagesToTake

قابل للتطبيق فقط عند تعيين textSplitMode إلى "الصفحات". إذا تم تحديدها، سيتوقف SplitSkill عن التقسيم بعد معالجة صفحات "maximumPagesToTake" الأولى، من أجل تحسين الأداء عند الحاجة إلى بضع صفحات أولية فقط من كل مستند.

maxPageLength

الحد الأقصى المطلوب لطول الصفحة. الافتراضي هو 10000.

odatatype

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

pageOverlapLength

قابل للتطبيق فقط عند تعيين textSplitMode إلى "الصفحات". إذا تم تحديده، ستبدأ المجموعة n+1 بهذا العدد من الأحرف/الرموز المميزة من نهاية المجموعة nth.

textSplitMode

قيمة تشير إلى وضع التقسيم المطلوب تنفيذه.

الخصائص الموروثة

context

يمثل المستوى الذي تحدث فيه العمليات، مثل جذر المستند أو محتوى المستند (على سبيل المثال، /document أو /document/content). الإعداد الافتراضي هو /document.

description

وصف المهارة التي تصف مدخلات المهارة ومخرجاتها واستخدامها.

inputs

يمكن أن تكون مدخلات المهارات عمودا في مجموعة البيانات المصدر، أو إخراج مهارة المصدر.

name

اسم المهارة التي تحددها بشكل فريد داخل مجموعة المهارات. سيتم إعطاء مهارة بدون اسم معرف اسما افتراضيا لفهرسها المستند إلى 1 في صفيف المهارات، مسبوقا بالحرف '#'.

outputs

إخراج المهارة هو إما حقل في فهرس بحث، أو قيمة يمكن استهلاكها كمدخل من قبل مهارة أخرى.

تفاصيل الخاصية

defaultLanguageCode

قيمة تشير إلى رمز اللغة الذي يجب استخدامه. القيمة الافتراضية هي en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "bs" | "cs" | "et" | "he" | "hi" | "hr" | "hu" | "id" | "ja" | "lv" | "nb" | "nl" | "pl" | "ru" | "sk" | "sl" | "sv" | "tr" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

قيمة الخاصية

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "bs" | "cs" | "et" | "he" | "hi" | "hr" | "hu" | "id" | "ja" | "lv" | "nb" | "nl" | "pl" | "ru" | "sk" | "sl" | "sv" | "tr" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

قابل للتطبيق فقط عند تعيين textSplitMode إلى "الصفحات". إذا تم تحديدها، سيتوقف SplitSkill عن التقسيم بعد معالجة صفحات "maximumPagesToTake" الأولى، من أجل تحسين الأداء عند الحاجة إلى بضع صفحات أولية فقط من كل مستند.

maximumPagesToTake?: number

قيمة الخاصية

number

maxPageLength

الحد الأقصى المطلوب لطول الصفحة. الافتراضي هو 10000.

maxPageLength?: number

قيمة الخاصية

number

odatatype

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

odatatype: "#Microsoft.Skills.Text.SplitSkill"

قيمة الخاصية

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

قابل للتطبيق فقط عند تعيين textSplitMode إلى "الصفحات". إذا تم تحديده، ستبدأ المجموعة n+1 بهذا العدد من الأحرف/الرموز المميزة من نهاية المجموعة nth.

pageOverlapLength?: number

قيمة الخاصية

number

textSplitMode

قيمة تشير إلى وضع التقسيم المطلوب تنفيذه.

textSplitMode?: "pages" | "sentences"

قيمة الخاصية

"pages" | "sentences"

تفاصيل الخاصية الموروثة

context

يمثل المستوى الذي تحدث فيه العمليات، مثل جذر المستند أو محتوى المستند (على سبيل المثال، /document أو /document/content). الإعداد الافتراضي هو /document.

context?: string

قيمة الخاصية

string

موروثة منSearchIndexerSkill.context

description

وصف المهارة التي تصف مدخلات المهارة ومخرجاتها واستخدامها.

description?: string

قيمة الخاصية

string

موروثة منSearchIndexerSkill.description

inputs

يمكن أن تكون مدخلات المهارات عمودا في مجموعة البيانات المصدر، أو إخراج مهارة المصدر.

inputs: InputFieldMappingEntry[]

قيمة الخاصية

موروثة منSearchIndexerSkill.inputs

name

اسم المهارة التي تحددها بشكل فريد داخل مجموعة المهارات. سيتم إعطاء مهارة بدون اسم معرف اسما افتراضيا لفهرسها المستند إلى 1 في صفيف المهارات، مسبوقا بالحرف '#'.

name?: string

قيمة الخاصية

string

موروثة منSearchIndexerSkill.name

outputs

إخراج المهارة هو إما حقل في فهرس بحث، أو قيمة يمكن استهلاكها كمدخل من قبل مهارة أخرى.

outputs: OutputFieldMappingEntry[]

قيمة الخاصية

موروثة منSearchIndexerSkill.outputs