Partilhar via


PatternTokenizer interface

Tokenizer que utiliza a correspondência de padrões regex para construir tokens distintos. Este tokenizador é implementado com o Apache Lucene.

Propriedades

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: "CANON_EQ", "CASE_INSENSITIVE", "COMENTÁRIOS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

group

O ordinal baseado em zero do grupo correspondente no padrão de expressão regular para extrair em tokens. Utilize -1 se quiser utilizar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. A predefinição é -1. Valor predefinido: -1.

name

O nome do tokenizer. Só tem de conter letras, dígitos, espaços, travessões ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres.

odatatype

Discriminador Polimórfico

pattern

Um padrão de expressão regular para corresponder aos separadores de tokens. A predefinição é uma expressão que corresponde a um ou mais carateres de espaço em branco. Valor predefinido: \W+.

Detalhes de Propriedade

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: "CANON_EQ", "CASE_INSENSITIVE", "COMENTÁRIOS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: RegexFlags[]

Valor de Propriedade

group

O ordinal baseado em zero do grupo correspondente no padrão de expressão regular para extrair em tokens. Utilize -1 se quiser utilizar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. A predefinição é -1. Valor predefinido: -1.

group?: number

Valor de Propriedade

number

name

O nome do tokenizer. Só tem de conter letras, dígitos, espaços, travessões ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres.

name: string

Valor de Propriedade

string

odatatype

Discriminador Polimórfico

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Valor de Propriedade

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Um padrão de expressão regular para corresponder aos separadores de tokens. A predefinição é uma expressão que corresponde a um ou mais carateres de espaço em branco. Valor predefinido: \W+.

pattern?: string

Valor de Propriedade

string