Partager via


MicrosoftLanguageTokenizer Classe

Définition

Divise le texte en utilisant des règles spécifiques à la langue.

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")]
public class MicrosoftLanguageTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")>]
type MicrosoftLanguageTokenizer = class
    inherit Tokenizer
Public Class MicrosoftLanguageTokenizer
Inherits Tokenizer
Héritage
MicrosoftLanguageTokenizer
Attributs
Newtonsoft.Json.JsonObjectAttribute

Constructeurs

MicrosoftLanguageTokenizer()

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

Propriétés

IsSearchTokenizer

Obtient ou définit une valeur indiquant comment le générateur de jetons est utilisé. Définissez la valeur true si elle est utilisée comme générateur de jetons de recherche, false si elle est utilisée comme générateur de jetons d’indexation. La valeur par défaut est false.

Language

Obtient ou définit la langue à utiliser. La valeur par défaut est l’anglais. Les valeurs possibles sont les suivantes : 'bangla', 'bulgare', 'catalan', 'chineseSimplified', 'chineseTraditional', 'croate', 'czech', 'danois', 'dutch', 'english', 'français', 'german', 'greek', 'gujarati', 'hindi', 'icelandic', 'indonésien', 'italian', 'japanese', 'kannada', 'korean', 'malay', 'malayalam', 'marathi', 'norwegianBokmaal', 'polish', 'portugais', 'portugueseBrazilian', 'punjabi', 'romanian', 'russian', 'serbCyrillic', 'serbLatin', 'slovène', 'spanish', 'swedish', 'tamil', ' telugu', 'thai', 'ukrainian', 'urdu', 'vietnamien'

MaxTokenLength

Obtient ou définit la longueur maximale du jeton. Les jetons dépassant la longueur maximale sont fractionnés. La longueur maximale des jetons qui peut être utilisée est de 300 caractères. Les jetons de plus de 300 caractères sont d’abord divisés en jetons de longueur 300, puis chacun de ces jetons est fractionné en fonction de la longueur maximale définie. La valeur par défaut est 255.

Name

Obtient ou définit le nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.

(Hérité de Tokenizer)

Méthodes

Validate()

Validez l’objet .

S’applique à