MicrosoftLanguageStemmingTokenizer interface
Dzieli tekst przy użyciu reguł specyficznych dla języka i zmniejsza liczbę wyrazów do ich formularzy bazowych.
- Extends
Właściwości
is |
Wartość wskazująca sposób użycia tokenizatora. Ustaw wartość true, jeśli jest używana jako tokenizator wyszukiwania, ustaw wartość false, jeśli jest używana jako tokenizer indeksowania. Wartość domyślna to false. |
language | Język do użycia. Wartość domyślna to angielski. |
max |
Maksymalna długość tokenu. Tokeny dłuższe niż maksymalna długość są dzielone. Maksymalna długość tokenu, która może być używana, to 300 znaków. Tokeny dłuższe niż 300 znaków są najpierw podzielone na tokeny o długości 300, a następnie każdy z tych tokenów jest podzielony na podstawie ustawionej maksymalnej długości tokenu. Wartość domyślna to 255. |
odatatype | Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem |
Właściwości dziedziczone
name | Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków. |
Szczegóły właściwości
isSearchTokenizer
Wartość wskazująca sposób użycia tokenizatora. Ustaw wartość true, jeśli jest używana jako tokenizator wyszukiwania, ustaw wartość false, jeśli jest używana jako tokenizer indeksowania. Wartość domyślna to false.
isSearchTokenizer?: boolean
Wartość właściwości
boolean
language
Język do użycia. Wartość domyślna to angielski.
language?: MicrosoftStemmingTokenizerLanguage
Wartość właściwości
maxTokenLength
Maksymalna długość tokenu. Tokeny dłuższe niż maksymalna długość są dzielone. Maksymalna długość tokenu, która może być używana, to 300 znaków. Tokeny dłuższe niż 300 znaków są najpierw podzielone na tokeny o długości 300, a następnie każdy z tych tokenów jest podzielony na podstawie ustawionej maksymalnej długości tokenu. Wartość domyślna to 255.
maxTokenLength?: number
Wartość właściwości
number
odatatype
Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Wartość właściwości
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Szczegóły właściwości dziedziczonej
name
Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.
name: string
Wartość właściwości
string
Dziedziczone zBaseLexicalTokenizer.name