Freigeben über


PatternAnalyzer interface

Trennt Text flexibel über ein reguläres Ausdrucksmuster in Begriffe. Dieses Analysetool wird mit Apache Lucene implementiert.

Eigenschaften

flags

Flags für reguläre Ausdrücke. Mögliche Werte: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Ein Wert, der angibt, ob Begriffe klein geschrieben werden sollen. Der Standardwert ist "true". Standardwert: true.

name

Der Name des Analysetools. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

odatatype

Polymorpher Diskriminator

pattern

Ein Muster für reguläre Ausdrücke zum Abgleichen von Tokentrennzeichen. Der Standardwert ist ein Ausdruck, der einem oder mehreren Leerzeichen entspricht. Standardwert. \W+.

stopwords

Eine Liste von Stoppwörtern.

Details zur Eigenschaft

flags

Flags für reguläre Ausdrücke. Mögliche Werte: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Eigenschaftswert

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Ein Wert, der angibt, ob Begriffe klein geschrieben werden sollen. Der Standardwert ist "true". Standardwert: true.

lowerCaseTerms?: boolean

Eigenschaftswert

boolean

name

Der Name des Analysetools. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

name: string

Eigenschaftswert

string

odatatype

Polymorpher Diskriminator

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Eigenschaftswert

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Ein Muster für reguläre Ausdrücke zum Abgleichen von Tokentrennzeichen. Der Standardwert ist ein Ausdruck, der einem oder mehreren Leerzeichen entspricht. Standardwert. \W+.

pattern?: string

Eigenschaftswert

string

stopwords

Eine Liste von Stoppwörtern.

stopwords?: string[]

Eigenschaftswert

string[]