Udostępnij za pośrednictwem


MicrosoftLanguageStemmingTokenizer interface

Dzieli tekst przy użyciu reguł specyficznych dla języka i zmniejsza liczbę wyrazów do ich formularzy bazowych.

Extends

Właściwości

isSearchTokenizer

Wartość wskazująca sposób użycia tokenizatora. Ustaw wartość true, jeśli jest używana jako tokenizator wyszukiwania, ustaw wartość false, jeśli jest używana jako tokenizer indeksowania. Wartość domyślna to false.

language

Język do użycia. Wartość domyślna to angielski.

maxTokenLength

Maksymalna długość tokenu. Tokeny dłuższe niż maksymalna długość są dzielone. Maksymalna długość tokenu, która może być używana, to 300 znaków. Tokeny dłuższe niż 300 znaków są najpierw podzielone na tokeny o długości 300, a następnie każdy z tych tokenów jest podzielony na podstawie ustawionej maksymalnej długości tokenu. Wartość domyślna to 255.

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

Właściwości dziedziczone

name

Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

Szczegóły właściwości

isSearchTokenizer

Wartość wskazująca sposób użycia tokenizatora. Ustaw wartość true, jeśli jest używana jako tokenizator wyszukiwania, ustaw wartość false, jeśli jest używana jako tokenizer indeksowania. Wartość domyślna to false.

isSearchTokenizer?: boolean

Wartość właściwości

boolean

language

Język do użycia. Wartość domyślna to angielski.

language?: MicrosoftStemmingTokenizerLanguage

Wartość właściwości

maxTokenLength

Maksymalna długość tokenu. Tokeny dłuższe niż maksymalna długość są dzielone. Maksymalna długość tokenu, która może być używana, to 300 znaków. Tokeny dłuższe niż 300 znaków są najpierw podzielone na tokeny o długości 300, a następnie każdy z tych tokenów jest podzielony na podstawie ustawionej maksymalnej długości tokenu. Wartość domyślna to 255.

maxTokenLength?: number

Wartość właściwości

number

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Wartość właściwości

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Szczegóły właściwości dziedziczonej

name

Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

Dziedziczone zBaseLexicalTokenizer.name