DictionaryDecompounderTokenFilter interface
Zerlegt zusammengesetzte Wörter, die in vielen germanischen Sprachen vorkommen. Dieser Tokenfilter wird mit Apache Lucene implementiert.
- Extends
Eigenschaften
max |
Die maximale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die kürzer sind. Der Standardwert ist 15. Der Höchstwert ist 300. |
min |
Die minimale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die länger sind. Standard ist 2. Der Höchstwert ist 300. |
min |
Die minimale Wortgröße. Nur Wörter, die länger sind, werden verarbeitet. Der Standardwert ist 5. Der Höchstwert ist 300. |
odatatype | Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann |
only |
Ein Wert, der angibt, ob der Ausgabe nur das längste übereinstimmende Unterwort hinzugefügt werden soll. Der Standardwert ist "false". |
word |
Die Liste der Wörter, mit der abgeglichen werden soll. |
Geerbte Eigenschaften
name | Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. |
Details zur Eigenschaft
maxSubwordSize
Die maximale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die kürzer sind. Der Standardwert ist 15. Der Höchstwert ist 300.
maxSubwordSize?: number
Eigenschaftswert
number
minSubwordSize
Die minimale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die länger sind. Standard ist 2. Der Höchstwert ist 300.
minSubwordSize?: number
Eigenschaftswert
number
minWordSize
Die minimale Wortgröße. Nur Wörter, die länger sind, werden verarbeitet. Der Standardwert ist 5. Der Höchstwert ist 300.
minWordSize?: number
Eigenschaftswert
number
odatatype
Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
Eigenschaftswert
"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
onlyLongestMatch
Ein Wert, der angibt, ob der Ausgabe nur das längste übereinstimmende Unterwort hinzugefügt werden soll. Der Standardwert ist "false".
onlyLongestMatch?: boolean
Eigenschaftswert
boolean
wordList
Die Liste der Wörter, mit der abgeglichen werden soll.
wordList: string[]
Eigenschaftswert
string[]
Geerbte Eigenschaftsdetails
name
Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.
name: string
Eigenschaftswert
string
Geerbt vonBaseTokenFilter.name