PatternTokenizer interface
Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Questo tokenizer viene implementato usando Apache Lucene.
Proprietà
flags | Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES' |
group | Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre in token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1. |
name | Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri. |
odatatype | Discriminare polimorfico |
pattern | Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: |
Dettagli proprietà
flags
Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Valore della proprietà
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre in token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1.
group?: number
Valore della proprietà
number
name
Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.
name: string
Valore della proprietà
string
odatatype
Discriminare polimorfico
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Valore della proprietà
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: \W+
.
pattern?: string
Valore della proprietà
string