Dela via


WordDelimiterTokenFilter interface

Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene.

Extends

Egenskaper

catenateAll

Ett värde som anger om alla underordsdelar ska catenateds. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false.

catenateNumbers

Ett värde som anger om maximala körningar av antal delar ska cateneras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false.

catenateWords

Ett värde som anger om maximala körningar av orddelar kommer att catenated. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false.

generateNumberParts

Ett värde som anger om nummerunderord ska genereras. Standardvärdet är true.

generateWordParts

Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är true.

odatatype

Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

preserveOriginal

Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false.

protectedWords

En lista över token som skyddar mot att avgränsas.

splitOnCaseChange

Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är true.

splitOnNumerics

Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är true.

stemEnglishPossessive

Ett värde som anger om du vill ta bort avslutande "s" för varje underord. Standardvärdet är true.

Ärvda egenskaper

name

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

Egenskapsinformation

catenateAll

Ett värde som anger om alla underordsdelar ska catenateds. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false.

catenateAll?: boolean

Egenskapsvärde

boolean

catenateNumbers

Ett värde som anger om maximala körningar av antal delar ska cateneras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false.

catenateNumbers?: boolean

Egenskapsvärde

boolean

catenateWords

Ett värde som anger om maximala körningar av orddelar kommer att catenated. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false.

catenateWords?: boolean

Egenskapsvärde

boolean

generateNumberParts

Ett värde som anger om nummerunderord ska genereras. Standardvärdet är true.

generateNumberParts?: boolean

Egenskapsvärde

boolean

generateWordParts

Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är true.

generateWordParts?: boolean

Egenskapsvärde

boolean

odatatype

Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"

Egenskapsvärde

"#Microsoft.Azure.Search.WordDelimiterTokenFilter"

preserveOriginal

Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false.

preserveOriginal?: boolean

Egenskapsvärde

boolean

protectedWords

En lista över token som skyddar mot att avgränsas.

protectedWords?: string[]

Egenskapsvärde

string[]

splitOnCaseChange

Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är true.

splitOnCaseChange?: boolean

Egenskapsvärde

boolean

splitOnNumerics

Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är true.

splitOnNumerics?: boolean

Egenskapsvärde

boolean

stemEnglishPossessive

Ett värde som anger om du vill ta bort avslutande "s" för varje underord. Standardvärdet är true.

stemEnglishPossessive?: boolean

Egenskapsvärde

boolean

Information om ärvda egenskaper

name

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

name: string

Egenskapsvärde

string

Ärvd frånBaseTokenFilter.name