PatternAnalyzer interface
Elastycznie oddziela tekst na terminy za pomocą wzorca wyrażenia regularnego. Ten analizator jest implementowany przy użyciu platformy Apache Lucene.
Właściwości
flags | Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES" |
lower |
Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true. |
name | Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków. |
odatatype | Dyskryminujące polimorficzne |
pattern | Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: |
stopwords | Lista stopwords. |
Szczegóły właściwości
flags
Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Wartość właściwości
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true.
lowerCaseTerms?: boolean
Wartość właściwości
boolean
name
Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.
name: string
Wartość właściwości
string
odatatype
Dyskryminujące polimorficzne
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
Wartość właściwości
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+
.
pattern?: string
Wartość właściwości
string
stopwords
Lista stopwords.
stopwords?: string[]
Wartość właściwości
string[]