KnownTokenizerNames enum

الحزمة:: @azure/search-documents

تعريف قيم TokenizerName.

الحقول

Classic	الرمز المميز المستند إلى التدقيق النحوي المناسب لمعالجة معظم المستندات باللغة الأوروبية. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
EdgeNGram	رمز الإدخال من الحافة إلى n-غرام من الحجم (الأحجام) المحدد. راجع https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
Keyword	يصدر الإدخال بأكمله كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
Letter	يقسم النص على غير أحرف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
Lowercase	يقسم النص على غير أحرف ويحولها إلى أحرف صغيرة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
MicrosoftLanguageStemmingTokenizer	يقسم النص باستخدام قواعد خاصة باللغة ويقلل الكلمات إلى نماذجها الأساسية.
MicrosoftLanguageTokenizer	يقسم النص باستخدام قواعد خاصة باللغة.
NGram	رمز الإدخال في n-غرام من الحجم (الأحجام) المحدد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
PathHierarchy	الرمز المميز للتسلسلات الهرمية التي تشبه المسار. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
Pattern	Tokenizer الذي يستخدم مطابقة نمط regex لإنشاء رموز مميزة. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
Standard	محلل Lucene القياسي؛ يتكون من الرمز المميز القياسي وعامل تصفية الأحرف الصغيرة وعامل تصفية الإيقاف. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
UaxUrlEmail	رمز مميز لعناوين URL ورسائل البريد الإلكتروني كرمز مميز واحد. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
Whitespace	يقسم النص على مسافة بيضاء. راجع http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html