DictionaryDecompounderTokenFilter interface
Descompone las palabras compuestas que se encuentran en muchas lenguas germánicas. Este filtro de token se implementa mediante Apache Lucene.
- Extends
Propiedades
max |
Tamaño máximo de subpalabra. Solo se generan subpalabras más cortas de las que se generan. El valor predeterminado es 15. El máximo es 300. |
min |
Tamaño mínimo de subpalabra. Solo se generan subpalabras más largas de las que se generan. El valor predeterminado es 2. El máximo es 300. |
min |
Tamaño mínimo de palabra. Solo las palabras más largas que se procesan. El valor predeterminado es 5. El máximo es 300. |
odatatype | Discriminador polimórfico, que especifica los diferentes tipos que puede ser este objeto. |
only |
Valor que indica si se va a agregar solo la subpalabra coincidente más larga a la salida. El valor predeterminado es False. |
word |
Lista de palabras con las que se va a buscar coincidencia. |
Propiedades heredadas
name | Nombre del filtro de token. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. |
Detalles de las propiedades
maxSubwordSize
Tamaño máximo de subpalabra. Solo se generan subpalabras más cortas de las que se generan. El valor predeterminado es 15. El máximo es 300.
maxSubwordSize?: number
Valor de propiedad
number
minSubwordSize
Tamaño mínimo de subpalabra. Solo se generan subpalabras más largas de las que se generan. El valor predeterminado es 2. El máximo es 300.
minSubwordSize?: number
Valor de propiedad
number
minWordSize
Tamaño mínimo de palabra. Solo las palabras más largas que se procesan. El valor predeterminado es 5. El máximo es 300.
minWordSize?: number
Valor de propiedad
number
odatatype
Discriminador polimórfico, que especifica los diferentes tipos que puede ser este objeto.
odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
Valor de propiedad
"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
onlyLongestMatch
Valor que indica si se va a agregar solo la subpalabra coincidente más larga a la salida. El valor predeterminado es False.
onlyLongestMatch?: boolean
Valor de propiedad
boolean
wordList
Lista de palabras con las que se va a buscar coincidencia.
wordList: string[]
Valor de propiedad
string[]
Detalles de las propiedades heredadas
name
Nombre del filtro de token. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.
name: string
Valor de propiedad
string
Heredado deBaseTokenFilter.name