PatternTokenizer interface

Pacchetto:: @azure/search-documents

Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Questo tokenizer viene implementato tramite Apache Lucene.

Proprietà

flags	Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
group	Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre nei token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1.
name	Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
odatatype	Discriminare polimorfico
pattern	Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: `\W+`.

Dettagli proprietà

flags

Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Valore della proprietà

group

Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre nei token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1.

group?: number

Valore della proprietà

number

name

Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminare polimorfico

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Valore della proprietà

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: \W+.

pattern?: string

Valore della proprietà

string