PatternTokenizer interface
Tokenizador que usa la coincidencia de patrones regex para construir tokens distintos. Este tokenizador se implementa mediante Apache Lucene.
Propiedades
flags | Marcas de expresión regular. Entre los valores posibles se incluyen: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES' |
group | Ordinal de base cero del grupo coincidente en el patrón de expresión regular que se va a extraer en tokens. Use -1 si desea usar todo el patrón para dividir la entrada en tokens, independientemente de los grupos coincidentes. El valor predeterminado es -1. Valor predeterminado: -1. |
name | Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. |
odatatype | Discriminador polimórfico |
pattern | Patrón de expresión regular para buscar coincidencias con separadores de token. El valor predeterminado es una expresión que coincide con uno o varios caracteres de espacio en blanco. Valor predeterminado: |
Detalles de las propiedades
flags
Marcas de expresión regular. Entre los valores posibles se incluyen: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Valor de propiedad
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
Ordinal de base cero del grupo coincidente en el patrón de expresión regular que se va a extraer en tokens. Use -1 si desea usar todo el patrón para dividir la entrada en tokens, independientemente de los grupos coincidentes. El valor predeterminado es -1. Valor predeterminado: -1.
group?: number
Valor de propiedad
number
name
Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.
name: string
Valor de propiedad
string
odatatype
Discriminador polimórfico
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Valor de propiedad
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Patrón de expresión regular para buscar coincidencias con separadores de token. El valor predeterminado es una expresión que coincide con uno o varios caracteres de espacio en blanco. Valor predeterminado: \W+
.
pattern?: string
Valor de propiedad
string