MicrosoftLanguageStemmingTokenizer interface
Divise le texte à l’aide de règles spécifiques à la langue et réduit les mots à leurs formulaires de base.
- Extends
Propriétés
| is |
Valeur indiquant comment le tokenizer est utilisé. Définissez la valeur true si elle est utilisée comme générateur de jetons de recherche, définie sur false si elle est utilisée comme générateur de jetons d’indexation. La valeur par défaut est false. |
| language | Langue à utiliser. La valeur par défaut est l’anglais. |
| max |
Longueur maximale du jeton. Les jetons plus longs que la longueur maximale sont fractionnés. La longueur maximale du jeton qui peut être utilisée est de 300 caractères. Les jetons de plus de 300 caractères sont d’abord divisés en jetons de longueur 300, puis chacun de ces jetons est divisé en fonction de la longueur maximale du jeton défini. La valeur par défaut est 255. |
| odatatype | Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être |
Propriétés héritées
| name | Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères. |
Détails de la propriété
isSearchTokenizer
Valeur indiquant comment le tokenizer est utilisé. Définissez la valeur true si elle est utilisée comme générateur de jetons de recherche, définie sur false si elle est utilisée comme générateur de jetons d’indexation. La valeur par défaut est false.
isSearchTokenizer?: boolean
Valeur de propriété
boolean
language
Langue à utiliser. La valeur par défaut est l’anglais.
language?: MicrosoftStemmingTokenizerLanguage
Valeur de propriété
maxTokenLength
Longueur maximale du jeton. Les jetons plus longs que la longueur maximale sont fractionnés. La longueur maximale du jeton qui peut être utilisée est de 300 caractères. Les jetons de plus de 300 caractères sont d’abord divisés en jetons de longueur 300, puis chacun de ces jetons est divisé en fonction de la longueur maximale du jeton défini. La valeur par défaut est 255.
maxTokenLength?: number
Valeur de propriété
number
odatatype
Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Valeur de propriété
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Détails de la propriété héritée
name
Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères.
name: string
Valeur de propriété
string
Hérité deLexicalTokenizer.name