Freigeben über


MicrosoftLanguageStemmingTokenizer Konstruktoren

Definition

Überlädt

MicrosoftLanguageStemmingTokenizer()

Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.

MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>)

Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.

MicrosoftLanguageStemmingTokenizer()

Quelle:
MicrosoftLanguageStemmingTokenizer.cs

Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.

public MicrosoftLanguageStemmingTokenizer ();
Public Sub New ()

Gilt für:

MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>)

Quelle:
MicrosoftLanguageStemmingTokenizer.cs

Initialisiert eine neue instance der MicrosoftLanguageStemmingTokenizer-Klasse.

public MicrosoftLanguageStemmingTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftStemmingTokenizerLanguage) = Nothing)

Parameter

name
String

Der Name des Tokenizers. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

maxTokenLength
Nullable<Int32>

Die maximale Tokenlänge. Token, die die maximale Länge überschreiten, werden geteilt. Ein Token darf maximal 300 Zeichen lang sein. Token, die länger als 300 Zeichen sind, werden zuerst in Token mit der Länge 300 aufgeteilt, und dann wird jedes dieser Token basierend auf der maximalen Tokenlänge aufgeteilt. Der Standardwert ist 255.

isSearchTokenizer
Nullable<Boolean>

Ein Wert, der angibt, wie der Tokenizer verwendet wird. Legen Sie auf true fest, wenn sie als Suchtokenizer verwendet wird, und legen Sie auf false fest, wenn sie als Indizierungstokenizer verwendet wird. Der Standardwert ist "false".

language
Nullable<MicrosoftStemmingTokenizerLanguage>

Die zu verwendende Sprache. Der Standardwert ist Englisch. Mögliche Werte sind: "arabisch", "bangla", "bulgarian", "catalan", "croatian", "czech", "danish", "dutch", "english", "estonian", "finnish", "french", "german", "greek", "gujarati", "hebrew", "hindi", "hungarian", "isländisch", "indonesisch", "italienisch", "kannada", "lettisch", "litauisch", "malay", "malayalam", "marathi", "norwegianBokmaal", "polish", "portugiesischBrazilian", "punjabi", "rumänisch", "russisch", "serbischCyrillic", "serbianLatin", "slovak", "slowenisch", "spanisch", "schwedisch", "tamil", "telugu", "türkisch", "ukrainisch", "urdu"

Gilt für: