CustomAnalyzer interface
Hiermee kunt u de controle overnemen over het proces van het converteren van tekst naar indexeerbare/doorzoekbare tokens. Het is een door de gebruiker gedefinieerde configuratie die bestaat uit één vooraf gedefinieerde tokenizer en een of meer filters. De tokenizer is verantwoordelijk voor het opsplitsen van tekst in tokens en de filters voor het wijzigen van tokens die door de tokenizer worden verzonden.
Eigenschappen
char |
Een lijst met tekenfilters die worden gebruikt om invoertekst voor te bereiden voordat deze door de tokenizer wordt verwerkt. Ze kunnen bijvoorbeeld bepaalde tekens of symbolen vervangen. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven. |
name | De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens. |
odatatype | Polymorfe discriminator |
token |
Een lijst met tokenfilters die worden gebruikt om de tokens die worden gegenereerd door een tokenizer uit te filteren of te wijzigen. U kunt bijvoorbeeld een filter voor kleine letters opgeven waarmee alle tekens worden geconverteerd naar kleine letters. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven. |
tokenizer |
De naam van de tokenizer die moet worden gebruikt om doorlopende tekst te verdelen in een reeks tokens, zoals het opsplitsen van een zin in woorden. KnownTokenizerNames is een opsomming met ingebouwde tokenizernamen. |
Eigenschapdetails
charFilters
Een lijst met tekenfilters die worden gebruikt om invoertekst voor te bereiden voordat deze door de tokenizer wordt verwerkt. Ze kunnen bijvoorbeeld bepaalde tekens of symbolen vervangen. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.
charFilters?: string[]
Waarde van eigenschap
string[]
name
De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.
name: string
Waarde van eigenschap
string
odatatype
Polymorfe discriminator
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Waarde van eigenschap
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Een lijst met tokenfilters die worden gebruikt om de tokens die worden gegenereerd door een tokenizer uit te filteren of te wijzigen. U kunt bijvoorbeeld een filter voor kleine letters opgeven waarmee alle tekens worden geconverteerd naar kleine letters. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.
tokenFilters?: string[]
Waarde van eigenschap
string[]
tokenizerName
De naam van de tokenizer die moet worden gebruikt om doorlopende tekst te verdelen in een reeks tokens, zoals het opsplitsen van een zin in woorden. KnownTokenizerNames is een opsomming met ingebouwde tokenizernamen.
tokenizerName: string
Waarde van eigenschap
string