Dela via


PatternAnalyzer interface

Separerar text flexibelt i termer via ett mönster för reguljära uttryck. Den här analysatorn implementeras med Apache Lucene.

Egenskaper

flags

Flaggor för reguljära uttryck. Möjliga värden är: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Ett värde som anger om termerna ska vara gemener. Standardvärdet är true. Standardvärde: true.

name

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, får bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

odatatype

Polymorfdiskriminator

pattern

Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera blankstegstecken. Standardvärde: \W+.

stopwords

En lista över stoppord.

Egenskapsinformation

flags

Flaggor för reguljära uttryck. Möjliga värden är: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Egenskapsvärde

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Ett värde som anger om termerna ska vara gemener. Standardvärdet är true. Standardvärde: true.

lowerCaseTerms?: boolean

Egenskapsvärde

boolean

name

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, får bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

name: string

Egenskapsvärde

string

odatatype

Polymorfdiskriminator

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Egenskapsvärde

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera blankstegstecken. Standardvärde: \W+.

pattern?: string

Egenskapsvärde

string

stopwords

En lista över stoppord.

stopwords?: string[]

Egenskapsvärde

string[]