Condividi tramite


CustomAnalyzer interface

Consente di controllare il processo di conversione del testo in token indicizzati/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.

Proprietà

charFilters

Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. ad esempio per sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.

name

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

odatatype

Discriminazione polimorfica

tokenFilters

Elenco di filtri token usati per filtrare o modificare i token generati da un tokenizer. È possibile, ad esempio, specificare un filtro lowercase che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.

tokenizerName

Nome del tokenizzatore da usare per dividere il testo continuo in una sequenza di token, ad esempio l'interruzione di una frase in parole. KnownTokenizerNames è un enumerazione contenente nomi di tokenizzatori predefiniti.

Dettagli proprietà

charFilters

Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. ad esempio per sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.

charFilters?: string[]

Valore della proprietà

string[]

name

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminazione polimorfica

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valore della proprietà

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Elenco di filtri token usati per filtrare o modificare i token generati da un tokenizer. È possibile, ad esempio, specificare un filtro lowercase che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.

tokenFilters?: string[]

Valore della proprietà

string[]

tokenizerName

Nome del tokenizzatore da usare per dividere il testo continuo in una sequenza di token, ad esempio l'interruzione di una frase in parole. KnownTokenizerNames è un enumerazione contenente nomi di tokenizzatori predefiniti.

tokenizerName: string

Valore della proprietà

string