Delen via


CustomAnalyzer interface

Hiermee kunt u de controle overnemen over het proces van het converteren van tekst naar indexeerbare/doorzoekbare tokens. Het is een door de gebruiker gedefinieerde configuratie die bestaat uit één vooraf gedefinieerde tokenizer en een of meer filters. De tokenizer is verantwoordelijk voor het opsplitsen van tekst in tokens en de filters voor het wijzigen van tokens die door de tokenizer worden verzonden.

Eigenschappen

charFilters

Een lijst met tekenfilters die worden gebruikt om invoertekst voor te bereiden voordat deze door de tokenizer wordt verwerkt. Ze kunnen bijvoorbeeld bepaalde tekens of symbolen vervangen. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.

name

De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.

odatatype

Polymorfe discriminator

tokenFilters

Een lijst met tokenfilters die worden gebruikt om de tokens die worden gegenereerd door een tokenizer uit te filteren of te wijzigen. U kunt bijvoorbeeld een filter voor kleine letters opgeven waarmee alle tekens worden geconverteerd naar kleine letters. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.

tokenizerName

De naam van de tokenizer die moet worden gebruikt om doorlopende tekst te verdelen in een reeks tokens, zoals het opsplitsen van een zin in woorden. KnownTokenizerNames is een opsomming met ingebouwde tokenizernamen.

Eigenschapdetails

charFilters

Een lijst met tekenfilters die worden gebruikt om invoertekst voor te bereiden voordat deze door de tokenizer wordt verwerkt. Ze kunnen bijvoorbeeld bepaalde tekens of symbolen vervangen. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.

charFilters?: string[]

Waarde van eigenschap

string[]

name

De naam van de analyse. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.

name: string

Waarde van eigenschap

string

odatatype

Polymorfe discriminator

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Waarde van eigenschap

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Een lijst met tokenfilters die worden gebruikt om de tokens die worden gegenereerd door een tokenizer uit te filteren of te wijzigen. U kunt bijvoorbeeld een filter voor kleine letters opgeven waarmee alle tekens worden geconverteerd naar kleine letters. De filters worden uitgevoerd in de volgorde waarin ze worden weergegeven.

tokenFilters?: string[]

Waarde van eigenschap

string[]

tokenizerName

De naam van de tokenizer die moet worden gebruikt om doorlopende tekst te verdelen in een reeks tokens, zoals het opsplitsen van een zin in woorden. KnownTokenizerNames is een opsomming met ingebouwde tokenizernamen.

tokenizerName: string

Waarde van eigenschap

string