İngilizce dilinde oku

Aracılığıyla paylaş


TokenFilterName type

TokenFilterName değerlerini tanımlar.
<xref:KnownTokenFilterName> TokenFilterName ile birbirinin yerine kullanılabilir, bu sabit listesi hizmetin desteklediği bilinen değerleri içerir.

Hizmet tarafından desteklenen bilinen değerler

arabic_normalization: Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
kesme işareti: Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) çıkarır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
asciifolding: İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve simgesel Unicode karakterlerini, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram: Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width: CJK genişlik farklarını normalleştirir. Fullwidth ASCII değişkenlerini eşdeğer temel Latinceye, yarım genişlikli Katakana değişkenlerini de eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
klasik
: İngilizce sahiplik ve noktaları kısaltmalardan kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams: Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2: Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
imtiyaz: elisyonları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization: Almanca karakterleri, German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization: Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçe metinleri normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization: Metnin Hint dillerindeki Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat: Gelen her belirteci bir kez anahtar sözcük olarak, bir kez de anahtar sözcük olmayan olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem: İngilizce için yüksek performanslı kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
uzunluk: Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
sınırı: Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
küçük harf: Belirteç metnini küçük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2: Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization: Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
fonetik
: Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem: Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer
ters: Belirteç dizesini ters çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_normalization: Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
scandinavian_folding: åÅäæÄÆ->a ve öÖøØ->o İskandinav karakterlerini katlar. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
shingle: Belirteçlerin bileşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
kartopu: Snowball tarafından oluşturulan kök ayırıcı kullanarak sözcüklerin köklerini oluşturan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization: Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer: Dile özgü kök kök filtreleme filtresi. Bkz. https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords: Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
kırpma: Belirteçlerin başındaki ve sonundaki boşlukları kırpılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
kesme: Terimleri belirli bir uzunluğa kadar kısaltın. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
benzersiz
: Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
büyük harf: Belirteç metnini büyük harfle normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter: Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.

type TokenFilterName = string