Partager via


MicrosoftLanguageTokenizer Constructeurs

Définition

Surcharges

MicrosoftLanguageTokenizer()

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

MicrosoftLanguageTokenizer()

Source:
MicrosoftLanguageTokenizer.cs

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

public MicrosoftLanguageTokenizer ();
Public Sub New ()

S’applique à

MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)

Source:
MicrosoftLanguageTokenizer.cs

Initialise une nouvelle instance de la classe MicrosoftLanguageTokenizer.

public MicrosoftLanguageTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftTokenizerLanguage) = Nothing)

Paramètres

name
String

Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.

maxTokenLength
Nullable<Int32>

Longueur maximale du jeton. Les jetons dépassant la longueur maximale sont fractionnés. La longueur maximale des jetons qui peut être utilisée est de 300 caractères. Les jetons de plus de 300 caractères sont d’abord divisés en jetons de longueur 300, puis chacun de ces jetons est fractionné en fonction de la longueur maximale définie. La valeur par défaut est 255.

isSearchTokenizer
Nullable<Boolean>

Valeur indiquant la façon dont le générateur de jetons est utilisé. Définissez sur true si utilisé comme générateur de jetons de recherche, sur false si utilisé comme générateur de jetons d’indexation. La valeur par défaut est false.

language
Nullable<MicrosoftTokenizerLanguage>

Langue à utiliser. La valeur par défaut est l’anglais. Les valeurs possibles incluent : 'bangla', 'bulgare', 'catalan', 'chineseSimplified', 'chineseTraditional', 'croate', 'czech', 'danish', 'dutch', 'english', 'français', 'german', 'greek', 'gujarati', 'hindi', 'islandais', 'indonésien', 'italian', 'japanese', 'kannada', 'korean', 'malayalam', 'malayalam', 'marathi', 'norwegianBokmaal', 'polish', 'portugais', 'portugueseBrazilian', 'punjabi', 'roumain', 'russian', 'serbCyrillic', 'serbLatin', 'slovène', 'espagnol', 'suédois', 'tamil', ' telugu', 'thai', 'ukrainien', 'ourdou', 'vietnamien'

S’applique à