LuceneStandardTokenizer interface

Pacchetto:: @azure/search-documents

Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.

Proprietà

maxTokenLength	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. Valore predefinito: 255.
name	Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
odatatype	Discriminare polimorfico

Dettagli proprietà

maxTokenLength

Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. Valore predefinito: 255.

maxTokenLength?: number

Valore della proprietà

number

name

Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminare polimorfico

odatatype: "#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"

Valore della proprietà

"#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"