Udostępnij za pośrednictwem


PatternAnalyzer interface

Elastycznie oddziela tekst na terminy za pomocą wzorca wyrażenia regularnego. Ten analizator jest implementowany przy użyciu platformy Apache Lucene.

Właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true.

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

odatatype

Dyskryminujące polimorficzne

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

stopwords

Lista stopwords.

Szczegóły właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: RegexFlags[]

Wartość właściwości

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true.

lowerCaseTerms?: boolean

Wartość właściwości

boolean

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

odatatype

Dyskryminujące polimorficzne

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Wartość właściwości

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

pattern?: string

Wartość właściwości

string

stopwords

Lista stopwords.

stopwords?: string[]

Wartość właściwości

string[]