WordDelimiterTokenFilter interface
Rozdělí slova na podsloví a provede volitelné transformace skupin podseloví. Tento filtr tokenů se implementuje pomocí Apache Lucene.
- Extends
Vlastnosti
catenate |
Hodnota označující, zda budou všechny části podslovu catenovány. Pokud je například nastavená hodnota true, azure-Search-1 se změní na AzureSearch1. Výchozí hodnota je false. |
catenate |
Hodnota označující, zda bude maximální počet spuštění číselných částí catenován. Pokud je například nastavená hodnota true, hodnota 1-2 se změní na 12. Výchozí hodnota je false. |
catenate |
Hodnota označující, zda bude maximální počet spuštění slovních částí očekávkován. Pokud je například nastavená hodnota true, azure-Search se změní na AzureSearch. Výchozí hodnota je false. |
generate |
Hodnota označující, zda se mají generovat číselné podwords. Platí výchozí hodnota. |
generate |
Hodnota označující, zda se mají generovat slova části. Je-li nastaven, způsobí, části slov být generovány; Například "AzureSearch" se změní na "Azure" "Search". Platí výchozí hodnota. |
odatatype | Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem |
preserve |
Hodnota označující, zda budou původní slova zachována a přidána do seznamu podseznamů. Výchozí hodnota je false. |
protected |
Seznam tokenů, které chcete chránit před oddělovači. |
split |
Hodnota označující, zda rozdělit slova na caseChange. Pokud je například nastavená hodnota true, azureSearch se změní na Azure Search. Platí výchozí hodnota. |
split |
Hodnota označující, jestli se má rozdělit podle čísel. Pokud je například nastavená hodnota true, Azure1Search se změní na Azure 1 a Search. Platí výchozí hodnota. |
stem |
Hodnota označující, jestli se má pro každé podslovo odebrat koncové "'s". Platí výchozí hodnota. |
Zděděné vlastnosti
name | Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků. |
Podrobnosti vlastnosti
catenateAll
Hodnota označující, zda budou všechny části podslovu catenovány. Pokud je například nastavená hodnota true, azure-Search-1 se změní na AzureSearch1. Výchozí hodnota je false.
catenateAll?: boolean
Hodnota vlastnosti
boolean
catenateNumbers
Hodnota označující, zda bude maximální počet spuštění číselných částí catenován. Pokud je například nastavená hodnota true, hodnota 1-2 se změní na 12. Výchozí hodnota je false.
catenateNumbers?: boolean
Hodnota vlastnosti
boolean
catenateWords
Hodnota označující, zda bude maximální počet spuštění slovních částí očekávkován. Pokud je například nastavená hodnota true, azure-Search se změní na AzureSearch. Výchozí hodnota je false.
catenateWords?: boolean
Hodnota vlastnosti
boolean
generateNumberParts
Hodnota označující, zda se mají generovat číselné podwords. Platí výchozí hodnota.
generateNumberParts?: boolean
Hodnota vlastnosti
boolean
generateWordParts
Hodnota označující, zda se mají generovat slova části. Je-li nastaven, způsobí, části slov být generovány; Například "AzureSearch" se změní na "Azure" "Search". Platí výchozí hodnota.
generateWordParts?: boolean
Hodnota vlastnosti
boolean
odatatype
Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem
odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"
Hodnota vlastnosti
"#Microsoft.Azure.Search.WordDelimiterTokenFilter"
preserveOriginal
Hodnota označující, zda budou původní slova zachována a přidána do seznamu podseznamů. Výchozí hodnota je false.
preserveOriginal?: boolean
Hodnota vlastnosti
boolean
protectedWords
Seznam tokenů, které chcete chránit před oddělovači.
protectedWords?: string[]
Hodnota vlastnosti
string[]
splitOnCaseChange
Hodnota označující, zda rozdělit slova na caseChange. Pokud je například nastavená hodnota true, azureSearch se změní na Azure Search. Platí výchozí hodnota.
splitOnCaseChange?: boolean
Hodnota vlastnosti
boolean
splitOnNumerics
Hodnota označující, jestli se má rozdělit podle čísel. Pokud je například nastavená hodnota true, Azure1Search se změní na Azure 1 a Search. Platí výchozí hodnota.
splitOnNumerics?: boolean
Hodnota vlastnosti
boolean
stemEnglishPossessive
Hodnota označující, jestli se má pro každé podslovo odebrat koncové "'s". Platí výchozí hodnota.
stemEnglishPossessive?: boolean
Hodnota vlastnosti
boolean
Podrobnosti zděděných vlastností
name
Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno zBaseTokenFilter.name