Sdílet prostřednictvím


CustomLexicalNormalizer interface

Umožňuje nakonfigurovat normalizaci pro filtrovatelná, řazená a omezující pole, která ve výchozím nastavení fungují s striktním porovnáváním. Jedná se o uživatelsky definovanou konfiguraci, která se skládá z alespoň jednoho nebo více filtrů, které upravují uložený token.

Extends

Vlastnosti

charFilters

Seznam filtrů znaků sloužících k přípravě vstupního textu před zpracováním. Mohou například nahradit určité znaky nebo symboly. Filtry se spouští v pořadí, v jakém jsou uvedeny.

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

tokenFilters

Seznam filtrů tokenů použitých k vyfiltrování nebo úpravě vstupního tokenu. Můžete například zadat filtr malými písmeny, který převede všechny znaky na malá písmena. Filtry se spouští v pořadí, v jakém jsou uvedeny.

Zděděné vlastnosti

name

Název normalizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků. Nemůže končit řetězcem .microsoft ani .lucene, ani nesmí mít název "asciifolding", "standard", "malá písmena", "velká písmena" nebo "elision".

Podrobnosti vlastnosti

charFilters

Seznam filtrů znaků sloužících k přípravě vstupního textu před zpracováním. Mohou například nahradit určité znaky nebo symboly. Filtry se spouští v pořadí, v jakém jsou uvedeny.

charFilters?: string[]

Hodnota vlastnosti

string[]

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

odatatype: "#Microsoft.Azure.Search.CustomNormalizer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.CustomNormalizer"

tokenFilters

Seznam filtrů tokenů použitých k vyfiltrování nebo úpravě vstupního tokenu. Můžete například zadat filtr malými písmeny, který převede všechny znaky na malá písmena. Filtry se spouští v pořadí, v jakém jsou uvedeny.

tokenFilters?: string[]

Hodnota vlastnosti

string[]

Podrobnosti zděděných vlastností

name

Název normalizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků. Nemůže končit řetězcem .microsoft ani .lucene, ani nesmí mít název "asciifolding", "standard", "malá písmena", "velká písmena" nebo "elision".

name: string

Hodnota vlastnosti

string

Zděděno poBaseLexicalNormalizer.name