MicrosoftLanguageTokenizer interface
Divide o texto com regras específicas do idioma.
- Extends
Propriedades
is |
Um valor que indica como o tokenizer é utilizado. Defina como verdadeiro se for utilizado como tokenizador de pesquisa, defina como falso se for utilizado como o tokenizador de indexação. A predefinição é falso. |
language | O idioma a utilizar. A predefinição é inglês. |
max |
O comprimento máximo do token. Os tokens com mais comprimento do que o comprimento máximo são divididos. O comprimento máximo do token que pode ser utilizado é de 300 carateres. Os tokens com mais de 300 carateres são divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. A predefinição é 255. |
odatatype | Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser |
Propriedades Herdadas
name | O nome do tokenizer. Só tem de conter letras, dígitos, espaços, traços ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres. |
Detalhes de Propriedade
isSearchTokenizer
Um valor que indica como o tokenizer é utilizado. Defina como verdadeiro se for utilizado como tokenizador de pesquisa, defina como falso se for utilizado como o tokenizador de indexação. A predefinição é falso.
isSearchTokenizer?: boolean
Valor de Propriedade
boolean
language
O idioma a utilizar. A predefinição é inglês.
language?: MicrosoftTokenizerLanguage
Valor de Propriedade
maxTokenLength
O comprimento máximo do token. Os tokens com mais comprimento do que o comprimento máximo são divididos. O comprimento máximo do token que pode ser utilizado é de 300 carateres. Os tokens com mais de 300 carateres são divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. A predefinição é 255.
maxTokenLength?: number
Valor de Propriedade
number
odatatype
Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
Valor de Propriedade
"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
Detalhes da Propriedade Herdada
name
O nome do tokenizer. Só tem de conter letras, dígitos, espaços, traços ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres.
name: string
Valor de Propriedade
string
Herdado deBaseLexicalTokenizer.name