KnownTokenizerNames enum

القيم المعروفة ل LexicalTokenizerName التي تقبلها الخدمة.

الحقول

Classic

الرمز المميز المستند إلى التدقيق النحوي المناسب لمعالجة معظم المستندات باللغة الأوروبية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

EdgeNGram

رمز الإدخال من حافة إلى n-grams من الحجم (الأحجام) المحددة. راجع https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

Keyword

يصدر الإدخال بأكمله كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

Letter

يقسم النص على غير أحرف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

Lowercase

يقسم النص على أحرف غير ويحولها إلى أحرف صغيرة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

MicrosoftLanguageStemmingTokenizer

يقسم النص باستخدام قواعد خاصة باللغة ويقلل من الكلمات إلى نماذجها الأساسية.

MicrosoftLanguageTokenizer

يقسم النص باستخدام قواعد خاصة باللغة.

NGram

يقوم بتكوين الإدخال في n-grams من الحجم (الأحجام) المحدد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

PathHierarchy

رمز مميز للتسلسلات الهرمية التي تشبه المسار. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

Pattern

الرمز المميز الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

Standard

محلل Lucene القياسي؛ يتكون من الرمز المميز القياسي وعامل تصفية الأحرف الصغيرة وعامل تصفية الإيقاف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

UaxUrlEmail

الرمز المميز لعناوين URL ورسائل البريد الإلكتروني كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

Whitespace

يقسم النص إلى مسافة بيضاء. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html