EdgeNGramTokenizer interface
Tokenise l’entrée d’un bord en n-grammes de la ou des tailles données. Ce tokenizer est implémenté à l’aide d’Apache Lucene.
- Extends
Propriétés
| max |
Longueur maximale de n-gramme. La valeur par défaut est 2. La valeur maximale est de 300. |
| min |
Longueur minimale de n-gramme. La valeur par défaut est 1. La valeur maximale est de 300. Doit être inférieur à la valeur de maxGram. |
| odatatype | Fragment d’URI spécifiant le type de générateur de jetons. |
| token |
Classes de caractères à conserver dans les jetons. |
Propriétés héritées
| name | Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères. |
Détails de la propriété
maxGram
Longueur maximale de n-gramme. La valeur par défaut est 2. La valeur maximale est de 300.
maxGram?: number
Valeur de propriété
number
minGram
Longueur minimale de n-gramme. La valeur par défaut est 1. La valeur maximale est de 300. Doit être inférieur à la valeur de maxGram.
minGram?: number
Valeur de propriété
number
odatatype
Fragment d’URI spécifiant le type de générateur de jetons.
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
Valeur de propriété
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
Classes de caractères à conserver dans les jetons.
tokenChars?: TokenCharacterKind[]
Valeur de propriété
Détails de la propriété héritée
name
Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères.
name: string
Valeur de propriété
string
Hérité deLexicalTokenizer.name