CustomAnalyzer interface

يسمح لك بالتحكم في عملية تحويل النص إلى رموز مميزة قابلة للفهرسة/قابلة للبحث. إنه تكوين معرف من قبل المستخدم يتكون من رمز مميز واحد محدد مسبقا وعامل تصفية واحد أو أكثر. الرمز المميز مسؤول عن تقسيم النص إلى رموز مميزة، وعوامل التصفية لتعديل الرموز المميزة المنبعثة من الرمز المميز.

الخصائص

charFilters

قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

name

اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا.

odatatype

تمييزي متعدد الأشكال

tokenFilters

قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية صغير يحول جميع الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

tokenizerName

اسم الرمز المميز المراد استخدامه لتقسيم النص المستمر إلى تسلسل من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو قائمة تعداد تحتوي على أسماء رموز مميزة مضمنة.

تفاصيل الخاصية

charFilters

قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

charFilters?: string[]

قيمة الخاصية

string[]

name

اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرطات أو تسطير أسفل السطر، ويمكن أن يبدأ فقط وينتهي بأحرف أبجدية رقمية، ويقتصر على 128 حرفا.

name: string

قيمة الخاصية

string

odatatype

تمييزي متعدد الأشكال

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

قيمة الخاصية

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية صغير يحول جميع الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

tokenFilters?: string[]

قيمة الخاصية

string[]

tokenizerName

اسم الرمز المميز المراد استخدامه لتقسيم النص المستمر إلى تسلسل من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو قائمة تعداد تحتوي على أسماء رموز مميزة مضمنة.

tokenizerName: string

قيمة الخاصية

string