CustomAnalyzer interface
Consente di assumere il controllo del processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.
Proprietà
| char |
Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. Ad esempio, possono sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati. |
| name | Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri. |
| odatatype | Discriminare polimorfico |
| token |
Elenco di filtri di token usati per filtrare o modificare i token generati da un tokenizer. Ad esempio, è possibile specificare un filtro minuscolo che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati. |
| tokenizer |
Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole. knownTokenizerNames è un'enumerazione contenente nomi di tokenizer predefiniti. |
Dettagli proprietà
charFilters
Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. Ad esempio, possono sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.
charFilters?: string[]
Valore della proprietà
string[]
name
Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
name: string
Valore della proprietà
string
odatatype
Discriminare polimorfico
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valore della proprietà
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Elenco di filtri di token usati per filtrare o modificare i token generati da un tokenizer. Ad esempio, è possibile specificare un filtro minuscolo che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.
tokenFilters?: string[]
Valore della proprietà
string[]
tokenizerName
Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole. knownTokenizerNames è un'enumerazione contenente nomi di tokenizer predefiniti.
tokenizerName: string
Valore della proprietà
string