مشاركة عبر


PatternTokenizer interface

Tokenizer الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. يتم تنفيذ هذا الرمز المميز باستخدام Apache Lucene.

الخصائص

flags

علامات التعبير العادية. تتضمن القيم المحتملة: "CANON_EQ" و"CASE_INSENSITIVE" و"التعليقات" و"DOTALL" و"القيمة الحرفية" و"MULTILINE" و"UNICODE_CASE" و"UNIX_LINES"

group

الترتيب الصفري لمجموعة المطابقة في نمط التعبير العادي للاستخراج إلى الرموز المميزة. استخدم -1 إذا كنت تريد استخدام النمط بأكمله لتقسيم الإدخال إلى رموز مميزة، بغض النظر عن المجموعات المطابقة. الافتراضي هو -1. القيمة الافتراضية: -1.

name

اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا.

odatatype

تمييزي متعدد الأشكال

pattern

نمط تعبير عادي لمطابقة فواصل الرمز المميز. الافتراضي هو تعبير يطابق حرفا واحدا أو أكثر من أحرف المسافة البيضاء. القيمة الافتراضية: \W+.

تفاصيل الخاصية

flags

علامات التعبير العادية. تتضمن القيم المحتملة: "CANON_EQ" و"CASE_INSENSITIVE" و"التعليقات" و"DOTALL" و"القيمة الحرفية" و"MULTILINE" و"UNICODE_CASE" و"UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

قيمة الخاصية

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

group

الترتيب الصفري لمجموعة المطابقة في نمط التعبير العادي للاستخراج إلى الرموز المميزة. استخدم -1 إذا كنت تريد استخدام النمط بأكمله لتقسيم الإدخال إلى رموز مميزة، بغض النظر عن المجموعات المطابقة. الافتراضي هو -1. القيمة الافتراضية: -1.

group?: number

قيمة الخاصية

number

name

اسم الرمز المميز. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا.

name: string

قيمة الخاصية

string

odatatype

تمييزي متعدد الأشكال

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

قيمة الخاصية

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

نمط تعبير عادي لمطابقة فواصل الرمز المميز. الافتراضي هو تعبير يطابق حرفا واحدا أو أكثر من أحرف المسافة البيضاء. القيمة الافتراضية: \W+.

pattern?: string

قيمة الخاصية

string