Classic
|
الرمز المميز المستند إلى التدقيق النحوي المناسب لمعالجة معظم المستندات باللغة الأوروبية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
|
EdgeNGram
|
رمز الإدخال من حافة إلى n-grams من الحجم (الأحجام) المحددة. راجع https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
|
Keyword
|
يصدر الإدخال بأكمله كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
|
Letter
|
يقسم النص على غير أحرف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
|
Lowercase
|
يقسم النص على أحرف غير ويحولها إلى أحرف صغيرة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
|
MicrosoftLanguageStemmingTokenizer
|
يقسم النص باستخدام قواعد خاصة باللغة ويقلل من الكلمات إلى نماذجها الأساسية.
|
MicrosoftLanguageTokenizer
|
يقسم النص باستخدام قواعد خاصة باللغة.
|
NGram
|
يقوم بتكوين الإدخال في n-grams من الحجم (الأحجام) المحدد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
|
PathHierarchy
|
رمز مميز للتسلسلات الهرمية التي تشبه المسار. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
|
Pattern
|
الرمز المميز الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
|
Standard
|
محلل Lucene القياسي؛ يتكون من الرمز المميز القياسي وعامل تصفية الأحرف الصغيرة وعامل تصفية الإيقاف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
|
UaxUrlEmail
|
الرمز المميز لعناوين URL ورسائل البريد الإلكتروني كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
|
Whitespace
|
يقسم النص إلى مسافة بيضاء. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html
|