PatternTokenizer interface
Tokenizer الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. يتم تنفيذ هذا الرمز المميز باستخدام Apache Lucene.
الخصائص
| flags | علامات التعبير العادية. تتضمن القيم المحتملة: "CANON_EQ" و"CASE_INSENSITIVE" و"التعليقات" و"DOTALL" و"القيمة الحرفية" و"MULTILINE" و"UNICODE_CASE" و"UNIX_LINES" |
| group | الترتيب الصفري لمجموعة المطابقة في نمط التعبير العادي للاستخراج إلى الرموز المميزة. استخدم -1 إذا كنت تريد استخدام النمط بأكمله لتقسيم الإدخال إلى رموز مميزة، بغض النظر عن المجموعات المطابقة. الافتراضي هو -1. القيمة الافتراضية: -1. |
| name | اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا. |
| odatatype | تمييزي متعدد الأشكال |
| pattern | نمط تعبير عادي لمطابقة فواصل الرمز المميز. الافتراضي هو تعبير يطابق حرفا واحدا أو أكثر من أحرف المسافة البيضاء. القيمة الافتراضية: |
تفاصيل الخاصية
flags
علامات التعبير العادية. تتضمن القيم المحتملة: "CANON_EQ" و"CASE_INSENSITIVE" و"التعليقات" و"DOTALL" و"القيمة الحرفية" و"MULTILINE" و"UNICODE_CASE" و"UNIX_LINES"
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
قيمة الخاصية
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
الترتيب الصفري لمجموعة المطابقة في نمط التعبير العادي للاستخراج إلى الرموز المميزة. استخدم -1 إذا كنت تريد استخدام النمط بأكمله لتقسيم الإدخال إلى رموز مميزة، بغض النظر عن المجموعات المطابقة. الافتراضي هو -1. القيمة الافتراضية: -1.
group?: number
قيمة الخاصية
number
name
اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا.
name: string
قيمة الخاصية
string
odatatype
تمييزي متعدد الأشكال
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
قيمة الخاصية
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
نمط تعبير عادي لمطابقة فواصل الرمز المميز. الافتراضي هو تعبير يطابق حرفا واحدا أو أكثر من أحرف المسافة البيضاء. القيمة الافتراضية: \W+.
pattern?: string
قيمة الخاصية
string