مشاركة عبر


KnownTokenizerNames enum

القيم المعروفة LexicalTokenizerName التي تقبلها الخدمة.

الحقول

Classic

الرمز المميز المستند إلى التدقيق النحوي المناسب لمعالجة معظم المستندات باللغة الأوروبية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

EdgeNGram

رمز الإدخال من الحافة إلى n-غرام من الحجم (الأحجام) المحدد. راجع https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

Keyword

يصدر الإدخال بأكمله كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

Letter

يقسم النص على غير أحرف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

Lowercase

يقسم النص على غير أحرف ويحولها إلى أحرف صغيرة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

MicrosoftLanguageStemmingTokenizer

يقسم النص باستخدام قواعد خاصة باللغة ويقلل الكلمات إلى نماذجها الأساسية.

MicrosoftLanguageTokenizer

يقسم النص باستخدام قواعد خاصة باللغة.

NGram

رمز الإدخال في n-غرام من الحجم (الأحجام) المحدد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

PathHierarchy

الرمز المميز للتسلسلات الهرمية التي تشبه المسار. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

Pattern

Tokenizer الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

Standard

محلل Lucene القياسي؛ يتكون من الرمز المميز القياسي وعامل تصفية الأحرف الصغيرة وعامل تصفية الإيقاف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

UaxUrlEmail

رمز مميز لعناوين URL ورسائل البريد الإلكتروني كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

Whitespace

يقسم النص على مسافة بيضاء. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html