مشاركة عبر


TokenFilterName type

تعريف قيم TokenFilterName.
يمكن استخدام <xref:KnownTokenFilterName> بالتبادل مع TokenFilterName، يحتوي هذا التعداد على القيم المعروفة التي تدعمها الخدمة.

القيم المعروفة التي تدعمها الخدمة

arabic_normalization: عامل تصفية الرمز المميز الذي يطبق التطبيع العربي لتطبيع تقويم العظام. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
علامة اقتباس أحادية: يقوم بتعرية جميع الأحرف بعد فاصلة اقتباس أحادية (بما في ذلك الفاصلة العليا نفسها). راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
مجلدات asciifolding: تحويل أحرف Unicode الأبجدية والرقمية والرقمية التي ليست في أول 127 حرفا من أحرف ASCII (كتلة Unicode "اللاتينية الأساسية") إلى مكافئات ASCII الخاصة بها، إذا كانت هذه المكافئات موجودة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram: تشكل العلامات الكبيرة لمصطلحات CJK التي يتم إنشاؤها من الرمز المميز القياسي. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width: تسوية اختلافات عرض CJK. طي متغيرات ASCII بالكامل إلى متغيرات اللغة اللاتينية الأساسية المكافئة، ومتغيرات كاتاكانا نصف العرض في Kana المكافئة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
الكلاسيكية: يزيل الممتلكين الإنجليزية، والنقاط من الاختصارات. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams: إنشاء bigrams للمصطلحات المتكررة أثناء الفهرسة. ولا تزال المصطلحات المفردة مفهرسة أيضا، مع تغليفه. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2: ينشئ n-grams من الحجم (الأحجام) المحدد بدءا من الجزء الأمامي أو الخلفي من رمز الإدخال المميز. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision: يزيل الحذف. على سبيل المثال، سيتم تحويل "l'avion" (المستوى) إلى "avion" (مستوى). راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization: تطبيع الأحرف الألمانية وفقا لاستدلال خوارزمية كرة الثلج الألمانية 2. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization: تطبيع النص باللغة الهندية لإزالة بعض الاختلافات في الاختلافات الإملائية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization: تطبيع تمثيل Unicode للنص باللغات الهندية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat: يصدر كل رمز وارد مرتين، مرة ككلمة أساسية ومرة واحدة كغير كلمة أساسية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem: عامل تصفية kstem عالي الأداء للغة الإنجليزية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
طول : يزيل الكلمات الطويلة جدا أو القصيرة جدا. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
حد : يحد من عدد الرموز المميزة أثناء الفهرسة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
أحرف صغيرة: تطبيع نص الرمز المميز إلى أحرف صغيرة. راجع https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2: يولد n-grams من الحجم (الأحجام) المحدد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization: يطبق التطبيع على الفارسية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
الصوتية: إنشاء رموز مميزة للمطابقات الصوتية. راجع https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem: يستخدم خوارزمية النبع النابعة لتحويل دفق الرمز المميز. راجع http://tartarus.org/~martin/PorterStemmer
عكس: عكس سلسلة الرمز المميز. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_normalization: تطبيع استخدام الأحرف الاسكندنافية القابلة للتبديل. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
scandinavian_folding: طي الأحرف الإسكندنافية åÅäääÄ اليوم ->a وöÖøØ->o. كما أنه يميز ضد استخدام حرف علوي مزدوج aa، ae، ao، oe وoo، تاركا أول واحد فقط. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
shingle: ينشئ مجموعات من الرموز المميزة كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
كرة الثلج: عامل تصفية ينبع من الكلمات باستخدام نابع ثلجي تم إنشاؤه. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization: تطبيع تمثيل Unicode لنص Sorani. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer: عامل تصفية فرعي خاص باللغة. راجع https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
كلمات التوقف: يزيل كلمات التوقف من دفق الرمز المميز. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
اقتطاع: اقتطاع المسافة البيضاء البادئة واللاحقة من الرموز المميزة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
اقتطاع: اقتطاع المصطلحات إلى طول معين. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
فريد: يقوم بتصفية الرموز المميزة بنفس النص مثل الرمز المميز السابق. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
أحرف كبيرة: تطبيع نص الرمز المميز إلى أحرف كبيرة. راجع https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter: تقسيم الكلمات إلى كلمات فرعية وإجراء تحويلات اختيارية على مجموعات الكلمات الفرعية.

type TokenFilterName = string