Condividi tramite


CustomAnalyzer interface

Consente di assumere il controllo del processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.

Proprietà

charFilters

Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. Ad esempio, possono sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.

name

Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

odatatype

Discriminare polimorfico

tokenFilters

Elenco di filtri di token usati per filtrare o modificare i token generati da un tokenizer. Ad esempio, è possibile specificare un filtro minuscolo che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.

tokenizerName

Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole. knownTokenizerNames è un'enumerazione contenente nomi di tokenizer predefiniti.

Dettagli proprietà

charFilters

Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. Ad esempio, possono sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.

charFilters?: string[]

Valore della proprietà

string[]

name

Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminare polimorfico

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valore della proprietà

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Elenco di filtri di token usati per filtrare o modificare i token generati da un tokenizer. Ad esempio, è possibile specificare un filtro minuscolo che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.

tokenFilters?: string[]

Valore della proprietà

string[]

tokenizerName

Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole. knownTokenizerNames è un'enumerazione contenente nomi di tokenizer predefiniti.

tokenizerName: string

Valore della proprietà

string