CustomAnalyzer interface
Consente di controllare il processo di conversione del testo in token indicizzati/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.
Proprietà
char |
Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. ad esempio per sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati. |
name | Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri. |
odatatype | Discriminazione polimorfica |
token |
Elenco di filtri token usati per filtrare o modificare i token generati da un tokenizer. È possibile, ad esempio, specificare un filtro lowercase che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati. |
tokenizer |
Nome del tokenizzatore da usare per dividere il testo continuo in una sequenza di token, ad esempio l'interruzione di una frase in parole. KnownTokenizerNames è un enumerazione contenente nomi di tokenizzatori predefiniti. |
Dettagli proprietà
charFilters
Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. ad esempio per sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.
charFilters?: string[]
Valore della proprietà
string[]
name
Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.
name: string
Valore della proprietà
string
odatatype
Discriminazione polimorfica
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valore della proprietà
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Elenco di filtri token usati per filtrare o modificare i token generati da un tokenizer. È possibile, ad esempio, specificare un filtro lowercase che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.
tokenFilters?: string[]
Valore della proprietà
string[]
tokenizerName
Nome del tokenizzatore da usare per dividere il testo continuo in una sequenza di token, ad esempio l'interruzione di una frase in parole. KnownTokenizerNames è un enumerazione contenente nomi di tokenizzatori predefiniti.
tokenizerName: string
Valore della proprietà
string