مشاركة عبر


CustomAnalyzer interface

يسمح لك بالتحكم في عملية تحويل النص إلى رموز مميزة قابلة للفهرسة/قابلة للبحث. إنه تكوين معرف من قبل المستخدم يتكون من رمز مميز واحد محدد مسبقا وعامل تصفية واحد أو أكثر. يكون الرمز المميز مسؤولا عن تقسيم النص إلى رموز مميزة، وعوامل التصفية لتعديل الرموز المميزة المنبعثة من الرمز المميز.

الخصائص

charFilters

قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

name

اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا.

odatatype

تمييزي متعدد الأشكال

tokenFilters

قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية بأحرف صغيرة يحول كافة الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

tokenizerName

اسم الرمز المميز الذي يجب استخدامه لتقسيم النص المستمر إلى سلسلة من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو تعداد يحتوي على أسماء رموز مميزة مضمنة.

تفاصيل الخاصية

charFilters

قائمة بعوامل تصفية الأحرف المستخدمة لإعداد نص الإدخال قبل معالجته بواسطة الرمز المميز. على سبيل المثال، يمكنهم استبدال أحرف أو رموز معينة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

charFilters?: string[]

قيمة الخاصية

string[]

name

اسم المحلل. يجب أن يحتوي فقط على أحرف أو أرقام أو مسافات أو شرط أو تسطير أسفل السطر، ويمكن أن يبدأ وينتهي بأحرف أبجدية رقمية فقط، ويقتصر على 128 حرفا.

name: string

قيمة الخاصية

string

odatatype

تمييزي متعدد الأشكال

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

قيمة الخاصية

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

قائمة بعوامل تصفية الرمز المميز المستخدمة لتصفية الرموز المميزة التي تم إنشاؤها بواسطة الرمز المميز أو تعديلها. على سبيل المثال، يمكنك تحديد عامل تصفية بأحرف صغيرة يحول كافة الأحرف إلى أحرف صغيرة. يتم تشغيل عوامل التصفية بالترتيب الذي يتم سردها به.

tokenFilters?: string[]

قيمة الخاصية

string[]

tokenizerName

اسم الرمز المميز الذي يجب استخدامه لتقسيم النص المستمر إلى سلسلة من الرموز المميزة، مثل تقسيم الجملة إلى كلمات. KnownTokenizerNames هو تعداد يحتوي على أسماء رموز مميزة مضمنة.

tokenizerName: string

قيمة الخاصية

string