Share via


PatternTokenizer Klasse

Definition

Tokenizer, der regex-Musterabgleich verwendet, um unterschiedliche Token zu erstellen. Dieser Tokenizer wird mithilfe von Apache Lucene implementiert. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.PatternTokenizer")]
public class PatternTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.PatternTokenizer")>]
type PatternTokenizer = class
    inherit Tokenizer
Public Class PatternTokenizer
Inherits Tokenizer
Vererbung
PatternTokenizer
Attribute
Newtonsoft.Json.JsonObjectAttribute

Konstruktoren

PatternTokenizer()

Initialisiert eine neue instance der PatternTokenizer-Klasse.

PatternTokenizer(String, String, Nullable<RegexFlags>, Nullable<Int32>)

Initialisiert eine neue instance der PatternTokenizer-Klasse.

Eigenschaften

Flags

Ruft reguläre Ausdrucksflags ab oder legt diese fest. Mögliche Werte: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

Group

Ruft die nullbasierte Ordnungszahl der übereinstimmenden Gruppe im Regulären Ausdrucksmuster ab, die in Token extrahiert werden soll, oder legt sie fest. Verwenden Sie -1, wenn Sie das gesamte Muster verwenden möchten, um die Eingabe unabhängig von übereinstimmenden Gruppen in Token aufzuteilen. Der Standardwert ist -1.

Name

Ruft den Namen des Tokenizers ab oder legt den Namen fest. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

(Geerbt von Tokenizer)
Pattern

Ruft ein Muster für reguläre Ausdrücke ab, das tokentrennzeichen entspricht, oder legt es fest. Standard ist ein Ausdruck, der einem oder mehreren Leerzeichen entspricht.

Methoden

Validate()

Überprüfen Sie das Objekt.

Gilt für: