TokenFilterName type

Balíček:: @azure/search-documents

Definuje hodnoty pro TokenFilterName.
<xref:KnownTokenFilterName> lze zaměnitelně s TokenFilterName, tento výčet obsahuje známé hodnoty, které služba podporuje.

Známé hodnoty podporované službou

arabic_normalization: Filtr tokenů, který použije arabský normalizátor k normalizaci orthografie. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
apostrof: Odstraní všechny znaky za apostrofem (včetně samotného apostrofu). Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
asciifolding: Převede abecední, číselné a symbolické znaky Unicode, které nejsou v prvních 127 znaky ASCII (blok "Základní latinka") na jejich ekvivalenty ASCII, pokud takové ekvivalenty existují. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram: Vytvoří bigramy termínů CJK, které jsou generovány ze standardního tokenizéru. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width: Normalizuje rozdíly šířky CJK. Přeloží varianty ASCII na ekvivalentní základní latinku a varianty Katakana s poloviční šířkou do ekvivalentní Kana. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
klasických: Odebere anglické přivlastňovací a tečky ze zkratek. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams: Vytvořte bigramy pro často se vyskytující termíny při indexování. Jednotlivé termíny jsou stále indexované, s překryvnými bigramy. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2: Generuje n-gramy dané velikosti počínaje přední nebo zadní částí vstupního tokenu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision: Odebere elize. Například "l'avion" (letadlo) bude převedeno na "avion" (letadlo). Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization: Normalizuje německé znaky podle heuristiky německého snowball algoritmu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization: Normalizuje text v hindštině, aby se odebraly některé rozdíly v pravopisných variantách. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization: Normalizuje reprezentaci textu unicode v indických jazycích. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat: Generuje každý příchozí token dvakrát, jednou jako klíčové slovo a jednou jako jiné než klíčové slovo. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem: Vysoce výkonný filtr kstem pro angličtinu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
délka: Odebere slova, která jsou příliš dlouhá nebo příliš krátká. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit: Omezuje počet tokenů při indexování. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
malá písmena: Normalizuje text tokenu na malá písmena. Podívejte se na https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2: Generuje n-gramy dané velikosti. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization: Použije normalizaci pro Perštinu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
fonetický: Vytvořte tokeny pro fonetické shody. Podívejte se na https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem: Používá algoritmus vytváření porterů k transformaci datového proudu tokenu. Podívejte se na http://tartarus.org/~martin/PorterStemmer
obrácení: Obrátí řetězec tokenu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_normalization: Normalizuje použití zaměnitelných severských znaků. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
scandinavian_folding: Složené severské znaky åÅäæÄÆ->a öÖøØ->o. Také diskriminuje použití dvojitých samohlásek aa, ae, ao, oe a oo, ponechání jen první. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
shingle: Vytvoří kombinace tokenů jako jeden token. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
sněhová koule: Filtr, který vychází ze slov pomocí snowballu generovaného stemmeru. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization: Normalizuje reprezentaci textu Sorani v kódování Unicode. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmeru: Filtr specifického pro jazyk. Podívejte se na https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords: Odebere slova stop ze streamu tokenu. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
oříznutí: Oříznou počáteční a koncové prázdné znaky z tokenů. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
zkrátit: Zkracuje termíny na určitou délku. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
jedinečných: Vyfiltruje tokeny se stejným textem jako předchozí token. Podívejte se na http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
velkými písmeny: Normalizuje text tokenu na velká písmena. Podívejte se na https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter: Rozdělí slova do podsloví a provede volitelné transformace skupin podwordů.

type TokenFilterName = string

Sdílet prostřednictvím

TokenFilterName type

Známé hodnoty podporované službou