MicrosoftLanguageStemmingTokenizer Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Divise le texte en utilisant des règles spécifiques à la langue et réduit les mots à leurs formes de base.
[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")]
public class MicrosoftLanguageStemmingTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")>]
type MicrosoftLanguageStemmingTokenizer = class
inherit Tokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits Tokenizer
- Héritage
- Attributs
-
Newtonsoft.Json.JsonObjectAttribute
Constructeurs
MicrosoftLanguageStemmingTokenizer() |
Initialise une nouvelle instance de la classe MicrosoftLanguageStemmingTokenizer. |
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>) |
Initialise une nouvelle instance de la classe MicrosoftLanguageStemmingTokenizer. |
Propriétés
IsSearchTokenizer |
Obtient ou définit une valeur indiquant comment le générateur de jetons est utilisé. Définissez sur true si utilisé comme générateur de jetons de recherche, sur false si utilisé comme générateur de jetons d’indexation. La valeur par défaut est false. |
Language |
Obtient ou définit la langue à utiliser. La valeur par défaut est l’anglais. Les valeurs possibles sont les suivantes : 'arabic', 'bangla', 'bulgare', 'catalan', 'croate', 'czech', 'danish', 'dutch', 'english', 'estonien', 'finnish', 'français', 'german', 'greek', 'gujarati', 'hebrew', 'hindi', 'hongrois', 'icelandic', 'indonésien', 'italian', 'kannada', 'letton', 'lituanien', 'malay', 'malayalam', 'marathi', 'norwegianBokmaal', 'polish', 'portugais', 'portugueseBrazilian', 'punjabi', 'roumain', 'russian', 'serbCyrillic', 'serbLatin', 'slovaque', 'slovène', 'espagnol', 'swedish', 'tamil', 'telugu', 'turc', 'ukrainien', 'ourdou' |
MaxTokenLength |
Obtient ou définit la longueur maximale du jeton. Les jetons dépassant la longueur maximale sont fractionnés. La longueur maximale des jetons qui peut être utilisée est de 300 caractères. Les jetons de plus de 300 caractères sont d’abord divisés en jetons de longueur 300, puis chacun de ces jetons est fractionné en fonction de la longueur maximale définie. La valeur par défaut est 255. |
Name |
Obtient ou définit le nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères. (Hérité de Tokenizer) |
Méthodes
Validate() |
Validez l’objet. |
S’applique à
Azure SDK for .NET
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour