DictionaryDecompounderTokenFilter interface
Decompõe palavras compostas encontradas em muitas línguas germânicas. Este filtro de token é implementado usando Apache Lucene.
- Extends
Propriedades
max |
O tamanho máximo da subpalavra. Apenas subpalavras mais curtas do que isso são produzidas. O padrão é 15. O máximo é de 300. |
min |
O tamanho mínimo da subpalavra. Apenas subpalavras maiores do que isso são produzidas. O padrão é 2. O máximo é de 300. |
min |
O tamanho mínimo da palavra. Apenas palavras mais longas do que isso são processadas. O padrão é 5. O máximo é de 300. |
odatatype | Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser |
only |
Um valor que indica se apenas a subpalavra correspondente mais longa deve ser adicionada à saída. O padrão é false. |
word |
A lista de palavras contra as quais corresponder. |
Propriedades Herdadas
name | O nome do filtro de token. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres. |
Detalhes de Propriedade
maxSubwordSize
O tamanho máximo da subpalavra. Apenas subpalavras mais curtas do que isso são produzidas. O padrão é 15. O máximo é de 300.
maxSubwordSize?: number
Valor de Propriedade
number
minSubwordSize
O tamanho mínimo da subpalavra. Apenas subpalavras maiores do que isso são produzidas. O padrão é 2. O máximo é de 300.
minSubwordSize?: number
Valor de Propriedade
number
minWordSize
O tamanho mínimo da palavra. Apenas palavras mais longas do que isso são processadas. O padrão é 5. O máximo é de 300.
minWordSize?: number
Valor de Propriedade
number
odatatype
Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser
odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
Valor de Propriedade
"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
onlyLongestMatch
Um valor que indica se apenas a subpalavra correspondente mais longa deve ser adicionada à saída. O padrão é false.
onlyLongestMatch?: boolean
Valor de Propriedade
boolean
wordList
A lista de palavras contra as quais corresponder.
wordList: string[]
Valor de Propriedade
string[]
Detalhes da Propriedade Herdada
name
O nome do filtro de token. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.
name: string
Valor de Propriedade
string
herdada deBaseTokenFilter.name