PatternAnalyzer interface
Op flexibele wijze scheidt u tekst in termen via een patroon voor reguliere expressies. Deze analyse wordt geïmplementeerd met behulp van Apache Lucene.
Eigenschappen
flags | Markeringen voor reguliere expressies. Mogelijke waarden zijn: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES' |
lower |
Een waarde die aangeeft of termen in kleine letters moeten worden gebruikt. De standaardwaarde is true. Standaardwaarde: true. |
name | De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens. |
odatatype | Polymorfe discriminator |
pattern | Een patroon voor reguliere expressies dat overeenkomt met tokenscheidingstekens. Standaard is een expressie die overeenkomt met een of meer witruimtetekens. Standaardwaarde: |
stopwords | Een lijst met stopwoorden. |
Eigenschapdetails
flags
Markeringen voor reguliere expressies. Mogelijke waarden zijn: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Waarde van eigenschap
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
Een waarde die aangeeft of termen in kleine letters moeten worden gebruikt. De standaardwaarde is true. Standaardwaarde: true.
lowerCaseTerms?: boolean
Waarde van eigenschap
boolean
name
De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.
name: string
Waarde van eigenschap
string
odatatype
Polymorfe discriminator
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
Waarde van eigenschap
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
Een patroon voor reguliere expressies dat overeenkomt met tokenscheidingstekens. Standaard is een expressie die overeenkomt met een of meer witruimtetekens. Standaardwaarde: \W+
.
pattern?: string
Waarde van eigenschap
string
stopwords
Een lijst met stopwoorden.
stopwords?: string[]
Waarde van eigenschap
string[]