CustomAnalyzer interface
يسمح لك بالتحكم في عملية تحويل النص إلى رموز مميزة قابلة للفهرسة/قابلة للبحث. إنه تكوين معرف من قبل المستخدم يتكون من رمز مميز واحد محدد مسبقا وعامل تصفية واحد أو أكثر. الرمز المميز مسؤول عن تقسيم النص إلى رموز مميزة، وعوامل التصفية لتعديل الرموز المميزة المنبعثة من الرمز المميز.
الخصائص
char |
قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به. |
name | اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا. |
odatatype | تمييزي متعدد الأشكال |
token |
قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية صغير يحول جميع الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به. |
tokenizer |
اسم الرمز المميز المراد استخدامه لتقسيم النص المستمر إلى تسلسل من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو قائمة تعداد تحتوي على أسماء رموز مميزة مضمنة. |
تفاصيل الخاصية
charFilters
قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.
charFilters?: string[]
قيمة الخاصية
string[]
name
اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا.
name: string
قيمة الخاصية
string
odatatype
تمييزي متعدد الأشكال
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
قيمة الخاصية
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية صغير يحول جميع الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.
tokenFilters?: string[]
قيمة الخاصية
string[]
tokenizerName
اسم الرمز المميز المراد استخدامه لتقسيم النص المستمر إلى تسلسل من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو قائمة تعداد تحتوي على أسماء رموز مميزة مضمنة.
tokenizerName: string
قيمة الخاصية
string