KnownTokenFilterNames enum

Referencia

Csomag:: @azure/search-documents

A szolgáltatás által elfogadott TokenFilterName ismert értékei.

Mezők

Apostrophe	Az aposztróf utáni összes karaktert (beleértve magát az aposztrófot is) csíkoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
ArabicNormalization	Egy jogkivonatszűrő, amely az arab normalizálót alkalmazza az ortográfia normalizálására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
AsciiFolding	Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
CjkBigram	A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
CjkWidth	Normalizálja a CJK szélességi különbségeit. A fullwidth ASCII-variánsokat a megfelelő alap latin, a félszélességű Katakana változatokat pedig a megfelelő Kana-ra hajtja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
Classic	Eltávolítja az angol birtokosokat és a betűket a betűszókból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
CommonGram	Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
EdgeNGram	A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
Elision	Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
GermanNormalization	Normalizálja a német karaktereket a german2 snowball algoritmus heurisztikusai szerint. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
HindiNormalization	Normalizálja a hindi szövegeket, hogy eltávolítson néhány különbséget a helyesírási változatokban. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
IndicNormalization	Normalizálja a szöveg Unicode-ábrázolását indiai nyelveken. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
KeywordRepeat	Minden bejövő jogkivonatot kétszer, egyszer kulcsszóként, egyszer pedig nem kulcsszóként bocsát ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
KStem	Nagy teljesítményű kstem szűrő angol nyelven. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
Length	Eltávolítja a túl hosszú vagy túl rövid szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
Limit	Korlátozza a tokenek számát az indexelés során. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
Lowercase	A jogkivonat szövegének normalizálása kisbetűsre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm
NGram	A megadott méret(ek) n-grammját hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
PersianNormalization	A perzsa normalizálását alkalmazza. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
Phonetic	Jogkivonatok létrehozása fonetikus egyezésekhez. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
PorterStem	A Porter-származtatási algoritmust használja a tokenstream átalakításához. Lásd: http://tartarus.org/~martin/PorterStemmer
Reverse	Megfordítja a jogkivonat-sztringet. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
ScandinavianFoldingNormalization	Folds skandináv karakterek åÅäæÄÆ-a> és öÖøØ-o>. Emellett megkülönbözteti a dupla magánhangzók aa, ae, ao, oe és oo használatát, így csak az első. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
ScandinavianNormalization	Normalizálja a felcserélhető skandináv karakterek használatát. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
Shingle	A jogkivonatok kombinációit egyetlen tokenként hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
Snowball	Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
SoraniNormalization	Normalizálja a Sorani-szöveg Unicode-ábrázolását. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
Stemmer	Nyelvspecifikus eredetszűrő. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
Stopwords	Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
Trim	Levágja a kezdő és a záró szóközt a jogkivonatokból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
Truncate	A kifejezéseket adott hosszúságúra csonkítja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
Unique	Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
Uppercase	A token szövegének normalizálása nagybetűsre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
WordDelimiter	A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon.

Megosztás a következőn keresztül:

KnownTokenFilterNames enum

Mezők

További források