MicrosoftLanguageStemmingTokenizer Konstruktoren
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Überlädt
MicrosoftLanguageStemmingTokenizer() |
Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse. |
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>) |
Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse. |
MicrosoftLanguageStemmingTokenizer()
Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.
public MicrosoftLanguageStemmingTokenizer ();
Public Sub New ()
Gilt für:
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>)
Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.
public MicrosoftLanguageStemmingTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftStemmingTokenizerLanguage) = Nothing)
Parameter
- name
- String
Der Name des Tokenizers. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.
Die maximale Tokenlänge. Token, die die maximale Länge überschreiten, werden geteilt. Ein Token darf maximal 300 Zeichen lang sein. Token, die länger als 300 Zeichen sind, werden zuerst in Token mit der Länge 300 aufgeteilt, und dann wird jedes dieser Token basierend auf der maximalen Tokenlänge aufgeteilt. Der Standardwert ist 255.
Ein Wert, der angibt, wie der Tokenizer verwendet wird. Legen Sie auf true fest, wenn sie als Suchtokenizer verwendet wird, und legen Sie auf false fest, wenn sie als Indizierungstokenizer verwendet wird. Der Standardwert ist "false".
- language
- Nullable<MicrosoftStemmingTokenizerLanguage>
Die zu verwendende Sprache. Der Standardwert ist Englisch. Mögliche Werte sind: "arabisch", "bangla", "bulgarian", "catalan", "croatian", "czech", "danish", "dutch", "english", "estonian", "finnish", "french", "german", "greek", "gujarati", "hebrew", "hindi", "hungarian", "isländisch", "indonesisch", "italienisch", "kannada", "lettisch", "litauisch", "malay", "malayalam", "marathi", "norwegianBokmaal", "polish", "portugiesischBrazilian", "punjabi", "rumänisch", "russisch", "serbischCyrillic", "serbianLatin", "slovak", "slowenisch", "spanisch", "schwedisch", "tamil", "telugu", "türkisch", "ukrainisch", "urdu"
Gilt für:
Azure SDK for .NET
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für