PatternAnalyzer interface
Trennt Text flexibel über ein reguläres Ausdrucksmuster in Begriffe. Dieses Analysetool wird mit Apache Lucene implementiert.
Eigenschaften
flags | Flags für reguläre Ausdrücke. Mögliche Werte: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES" |
lower |
Ein Wert, der angibt, ob Begriffe klein geschrieben werden sollen. Der Standardwert ist "true". Standardwert: true. |
name | Der Name des Analysetools. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. |
odatatype | Polymorpher Diskriminator |
pattern | Ein Muster für reguläre Ausdrücke zum Abgleichen von Tokentrennzeichen. Der Standardwert ist ein Ausdruck, der einem oder mehreren Leerzeichen entspricht. Standardwert. |
stopwords | Eine Liste von Stoppwörtern. |
Details zur Eigenschaft
flags
Flags für reguläre Ausdrücke. Mögliche Werte: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Eigenschaftswert
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
Ein Wert, der angibt, ob Begriffe klein geschrieben werden sollen. Der Standardwert ist "true". Standardwert: true.
lowerCaseTerms?: boolean
Eigenschaftswert
boolean
name
Der Name des Analysetools. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.
name: string
Eigenschaftswert
string
odatatype
Polymorpher Diskriminator
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
Eigenschaftswert
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
Ein Muster für reguläre Ausdrücke zum Abgleichen von Tokentrennzeichen. Der Standardwert ist ein Ausdruck, der einem oder mehreren Leerzeichen entspricht. Standardwert. \W+
.
pattern?: string
Eigenschaftswert
string
stopwords
Eine Liste von Stoppwörtern.
stopwords?: string[]
Eigenschaftswert
string[]