Sdílet prostřednictvím


PatternAnalyzer interface

Pružně rozděluje text na termíny pomocí vzoru regulárního výrazu. Tento analyzátor je implementovaný pomocí Apache Lucene.

Vlastnosti

flags

Příznaky regulárních výrazů. Mezi možné hodnoty patří: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Hodnota označující, jestli mají být termíny malé. Platí výchozí hodnota. Výchozí hodnota: true.

name

Název analyzátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

odatatype

Polymorfní diskriminace

pattern

Vzor regulárního výrazu, který odpovídá oddělovačům tokenů. Výchozí je výraz, který odpovídá jednomu nebo více prázdným znakům. Výchozí hodnota: \W+.

stopwords

Seznam dorazů.

Podrobnosti vlastnosti

flags

Příznaky regulárních výrazů. Mezi možné hodnoty patří: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: RegexFlags[]

Hodnota vlastnosti

lowerCaseTerms

Hodnota označující, jestli mají být termíny malé. Platí výchozí hodnota. Výchozí hodnota: true.

lowerCaseTerms?: boolean

Hodnota vlastnosti

boolean

name

Název analyzátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

name: string

Hodnota vlastnosti

string

odatatype

Polymorfní diskriminace

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Vzor regulárního výrazu, který odpovídá oddělovačům tokenů. Výchozí je výraz, který odpovídá jednomu nebo více prázdným znakům. Výchozí hodnota: \W+.

pattern?: string

Hodnota vlastnosti

string

stopwords

Seznam dorazů.

stopwords?: string[]

Hodnota vlastnosti

string[]