Udostępnij za pośrednictwem


WordDelimiterTokenFilter interface

Dzieli wyrazy na słowa podrzędne i wykonuje opcjonalne przekształcenia w grupach podrzędnych. Ten filtr tokenu jest implementowany przy użyciu platformy Apache Lucene.

Extends

Właściwości

catenateAll

Wartość wskazująca, czy wszystkie części podwordu zostaną podzielone. Jeśli na przykład ustawiono wartość true, wartość "Azure-Search-1" zmieni się na "AzureSearch1". Wartość domyślna to false.

catenateNumbers

Wartość wskazująca, czy maksymalna liczba przebiegów części będzie podzielona na kategoryzowane. Jeśli na przykład ustawiono wartość true, wartość "1–2" zostanie ustawiona na wartość "12". Wartość domyślna to false.

catenateWords

Wartość wskazująca, czy maksymalna liczba uruchomień części wyrazów zostanie podzielona na kategoryzowane. Jeśli na przykład ustawiono wartość true, wartość "Azure-Search" stanie się "AzureSearch". Wartość domyślna to false.

generateNumberParts

Wartość wskazująca, czy należy wygenerować podsieci liczbowe. Wartość domyślna to „true”.

generateWordParts

Wartość wskazująca, czy należy wygenerować wyrazy części. Jeśli jest ustawiona, powoduje wygenerowanie części wyrazów; na przykład "AzureSearch" staje się "Azure" "Search". Wartość domyślna to „true”.

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

preserveOriginal

Wartość wskazująca, czy oryginalne wyrazy zostaną zachowane i dodane do listy podordów. Wartość domyślna to false.

protectedWords

Lista tokenów, które mają być chronione przed ograniczeniem.

splitOnCaseChange

Wartość wskazująca, czy należy podzielić wyrazy na caseChange. Jeśli na przykład ustawiono wartość true, wyrażenie "AzureSearch" stanie się "Azure" "Search". Wartość domyślna to „true”.

splitOnNumerics

Wartość wskazująca, czy należy podzielić liczby. Jeśli na przykład ustawiono wartość true, "Azure1Search" stanie się "Azure" "1" "Wyszukaj". Wartość domyślna to „true”.

stemEnglishPossessive

Wartość wskazująca, czy usunąć końcowe "s" dla każdego podordu. Wartość domyślna to „true”.

Właściwości dziedziczone

name

Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

Szczegóły właściwości

catenateAll

Wartość wskazująca, czy wszystkie części podwordu zostaną podzielone. Jeśli na przykład ustawiono wartość true, wartość "Azure-Search-1" zmieni się na "AzureSearch1". Wartość domyślna to false.

catenateAll?: boolean

Wartość właściwości

boolean

catenateNumbers

Wartość wskazująca, czy maksymalna liczba przebiegów części będzie podzielona na kategoryzowane. Jeśli na przykład ustawiono wartość true, wartość "1–2" zostanie ustawiona na wartość "12". Wartość domyślna to false.

catenateNumbers?: boolean

Wartość właściwości

boolean

catenateWords

Wartość wskazująca, czy maksymalna liczba uruchomień części wyrazów zostanie podzielona na kategoryzowane. Jeśli na przykład ustawiono wartość true, wartość "Azure-Search" stanie się "AzureSearch". Wartość domyślna to false.

catenateWords?: boolean

Wartość właściwości

boolean

generateNumberParts

Wartość wskazująca, czy należy wygenerować podsieci liczbowe. Wartość domyślna to „true”.

generateNumberParts?: boolean

Wartość właściwości

boolean

generateWordParts

Wartość wskazująca, czy należy wygenerować wyrazy części. Jeśli jest ustawiona, powoduje wygenerowanie części wyrazów; na przykład "AzureSearch" staje się "Azure" "Search". Wartość domyślna to „true”.

generateWordParts?: boolean

Wartość właściwości

boolean

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"

Wartość właściwości

"#Microsoft.Azure.Search.WordDelimiterTokenFilter"

preserveOriginal

Wartość wskazująca, czy oryginalne wyrazy zostaną zachowane i dodane do listy podordów. Wartość domyślna to false.

preserveOriginal?: boolean

Wartość właściwości

boolean

protectedWords

Lista tokenów, które mają być chronione przed ograniczeniem.

protectedWords?: string[]

Wartość właściwości

string[]

splitOnCaseChange

Wartość wskazująca, czy należy podzielić wyrazy na caseChange. Jeśli na przykład ustawiono wartość true, wyrażenie "AzureSearch" stanie się "Azure" "Search". Wartość domyślna to „true”.

splitOnCaseChange?: boolean

Wartość właściwości

boolean

splitOnNumerics

Wartość wskazująca, czy należy podzielić liczby. Jeśli na przykład ustawiono wartość true, "Azure1Search" stanie się "Azure" "1" "Wyszukaj". Wartość domyślna to „true”.

splitOnNumerics?: boolean

Wartość właściwości

boolean

stemEnglishPossessive

Wartość wskazująca, czy usunąć końcowe "s" dla każdego podordu. Wartość domyślna to „true”.

stemEnglishPossessive?: boolean

Wartość właściwości

boolean

Szczegóły właściwości dziedziczonej

name

Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

Dziedziczone zBaseTokenFilter.name