WordDelimiterTokenFilter interface
Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene.
- Extends
Egenskaper
catenate |
Ett värde som anger om alla underordsdelar ska catenateds. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false. |
catenate |
Ett värde som anger om maximala körningar av antal delar ska cateneras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false. |
catenate |
Ett värde som anger om maximala körningar av orddelar kommer att catenated. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false. |
generate |
Ett värde som anger om nummerunderord ska genereras. Standardvärdet är true. |
generate |
Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är true. |
odatatype | Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara |
preserve |
Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false. |
protected |
En lista över token som skyddar mot att avgränsas. |
split |
Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är true. |
split |
Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är true. |
stem |
Ett värde som anger om du vill ta bort avslutande "s" för varje underord. Standardvärdet är true. |
Ärvda egenskaper
name | Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
Egenskapsinformation
catenateAll
Ett värde som anger om alla underordsdelar ska catenateds. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false.
catenateAll?: boolean
Egenskapsvärde
boolean
catenateNumbers
Ett värde som anger om maximala körningar av antal delar ska cateneras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false.
catenateNumbers?: boolean
Egenskapsvärde
boolean
catenateWords
Ett värde som anger om maximala körningar av orddelar kommer att catenated. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false.
catenateWords?: boolean
Egenskapsvärde
boolean
generateNumberParts
Ett värde som anger om nummerunderord ska genereras. Standardvärdet är true.
generateNumberParts?: boolean
Egenskapsvärde
boolean
generateWordParts
Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är true.
generateWordParts?: boolean
Egenskapsvärde
boolean
odatatype
Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara
odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"
Egenskapsvärde
"#Microsoft.Azure.Search.WordDelimiterTokenFilter"
preserveOriginal
Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false.
preserveOriginal?: boolean
Egenskapsvärde
boolean
protectedWords
En lista över token som skyddar mot att avgränsas.
protectedWords?: string[]
Egenskapsvärde
string[]
splitOnCaseChange
Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är true.
splitOnCaseChange?: boolean
Egenskapsvärde
boolean
splitOnNumerics
Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är true.
splitOnNumerics?: boolean
Egenskapsvärde
boolean
stemEnglishPossessive
Ett värde som anger om du vill ta bort avslutande "s" för varje underord. Standardvärdet är true.
stemEnglishPossessive?: boolean
Egenskapsvärde
boolean
Information om ärvda egenskaper
name
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.
name: string
Egenskapsvärde
string
Ärvd frånBaseTokenFilter.name