MicrosoftLanguageTokenizer interface
يقسم النص باستخدام قواعد خاصة باللغة.
- Extends
الخصائص
is |
قيمة تشير إلى كيفية استخدام الرمز المميز. اضبط على true إذا تم استخدامه كرمز مميز للبحث، اضبط على false إذا تم استخدامه كرمز مميز للفهرسة. الوضع الافتراضي خطأ. |
language | اللغة المراد استخدامها. الإعداد الافتراضي هو الإنجليزية. |
max |
الحد الأقصى لطول الرمز المميز. يتم تقسيم الرموز المميزة الأطول من الحد الأقصى للطول. الحد الأقصى لطول الرمز المميز الذي يمكن استخدامه هو 300 حرف. يتم تقسيم الرموز المميزة التي يزيد طولها عن 300 حرف أولا إلى رموز مميزة بطول 300 ثم يتم تقسيم كل من هذه الرموز المميزة استنادا إلى الحد الأقصى لمجموعة طول الرمز المميز. الافتراضي هو 255. |
odatatype | تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون عليها هذا الكائن |
الخصائص الموروثة
name | اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا. |
تفاصيل الخاصية
isSearchTokenizer
قيمة تشير إلى كيفية استخدام الرمز المميز. اضبط على true إذا تم استخدامه كرمز مميز للبحث، اضبط على false إذا تم استخدامه كرمز مميز للفهرسة. الوضع الافتراضي خطأ.
isSearchTokenizer?: boolean
قيمة الخاصية
boolean
language
اللغة المراد استخدامها. الإعداد الافتراضي هو الإنجليزية.
language?: MicrosoftTokenizerLanguage
قيمة الخاصية
maxTokenLength
الحد الأقصى لطول الرمز المميز. يتم تقسيم الرموز المميزة الأطول من الحد الأقصى للطول. الحد الأقصى لطول الرمز المميز الذي يمكن استخدامه هو 300 حرف. يتم تقسيم الرموز المميزة التي يزيد طولها عن 300 حرف أولا إلى رموز مميزة بطول 300 ثم يتم تقسيم كل من هذه الرموز المميزة استنادا إلى الحد الأقصى لمجموعة طول الرمز المميز. الافتراضي هو 255.
maxTokenLength?: number
قيمة الخاصية
number
odatatype
تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون عليها هذا الكائن
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
قيمة الخاصية
"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
تفاصيل الخاصية الموروثة
name
اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا.
name: string
قيمة الخاصية
string
موروث منBaseLexicalTokenizer.name